25.4277, Confs: Computational Ling, General Ling, Historical Ling, Text/Corpus Ling/Germany

Tue Oct 28 18:01:54 UTC 2014

LINGUIST List: Vol-25-4277. Tue Oct 28 2014. ISSN: 1069 - 4875.

Subject: 25.4277, Confs: Computational Ling, General Ling, Historical Ling, Text/Corpus Ling/Germany

Moderators: Damir Cavar, Indiana U <damir at linguistlist.org>
            Malgorzata E. Cavar, Indiana U <gosia at linguistlist.org>

Reviews: reviews at linguistlist.org
Anthony Aristar <aristar at linguistlist.org>
Helen Aristar-Dry <hdry at linguistlist.org>
Sara Couture, Indiana U <sara at linguistlist.org>

Homepage: http://linguistlist.org

Do you want to donate to LINGUIST without spending an extra penny? Bookmark
the Amazon link for your country below; then use it whenever you buy from
Amazon!

USA: http://www.amazon.com/?_encoding=UTF8&tag=linguistlist-20
Britain: http://www.amazon.co.uk/?_encoding=UTF8&tag=linguistlist-21
Germany: http://www.amazon.de/?_encoding=UTF8&tag=linguistlistd-21
Japan: http://www.amazon.co.jp/?_encoding=UTF8&tag=linguistlist-22
Canada: http://www.amazon.ca/?_encoding=UTF8&tag=linguistlistc-20
France: http://www.amazon.fr/?_encoding=UTF8&tag=linguistlistf-21

For more information on the LINGUIST Amazon store please visit our
FAQ at http://linguistlist.org/amazon-faq.cfm.

Editor for this issue: Evgeny Kim <egkim at indiana.edu>
================================================================  

Visit LL's Multitree project for over 1000 trees dynamically generated
from scholarly hypotheses about language relationships:
          http://multitree.linguistlist.org/

Date: Tue, 28 Oct 2014 14:01:40
From: Kay-Michael Würzner [wuerzner at bbaw.de]
Subject: 2. DTA-/CLARIN-D-Konferenz und CLARIN-D-Workshop:Textkorpora in Infrastrukturen für die Geistes- und Sozialwissenschaften

E-mail this message to a friend:
http://linguistlist.org/issues/emailmessage/verification.cfm?iss=25-4277.html&submissionid=35972817&topicid=4&msgnumber=1

2. DTA-/CLARIN-D-Konferenz und CLARIN-D-Workshop:Textkorpora in Infrastrukturen für die Geistes- und Sozialwissenschaften 

Date: 17-Nov-2014 - 18-Nov-2014 
Location: Berlin, Germany 
Contact: Christian Thomas 
Contact Email: thomas at bbaw.de 
Meeting URL: http://www.deutschestextarchiv.de/veranstaltungen/DTAClarinDConf2014 

Linguistic Field(s): Computational Linguistics; General Linguistics; Historical Linguistics; Text/Corpus Linguistics 

Meeting Description: 

Die zweite gemeinsame DTA- und CLARIN-D-Konferenz behandelt Bedeutung, Nutzen und Möglichkeiten der Nachnutzung von ''Textkorpora in Infrastrukturen für die Geistes- und Sozialwissenschaften''. In zwei übergeordneten Themenblöcken stellen issenschaftlerinnen und Wissenschaftler verschiedener geistes- und sozialwissenschaftlicher Disziplinen zum einen aktuelle, korpusgeleitete Forschungsfragen und zum anderen verschiedene Zugriffs- und Auswertungsmöglichkeiten für Textkorpora vor.

Der erste Themenblock beschäftigt sich mit den Möglichkeiten und den gegenwärtig noch bestehenden Grenzen korpusbasierter Forschung, um daraus Anforderungen an die zugrundeliegenden Daten und Infrastrukturen abzuleiten. Derzeit existieren viele Projekte, die den Aufbau von Textkorpora zum Inhalt haben und dabei von vielfältigen Erkenntnisinteressen geleitet sind. Die zentralen Aufgaben von Forschungsinfrastrukturen wie CLARIN bestehen unter anderem darin, solche Korpusressourcen zu sammeln, zu pflegen, ggf. weiter aufzubereiten sowie Werkzeuge zu deren Auswertung, Be- und Verarbeitung anzubieten. Auf diese Weise entstehen zunehmend große Textressourcen, welche Antworten auf neue und innovative Fragestellungen erlauben bzw. denkbar machen. Ein möglichst breit gefächerter Einblick aus der Perspektive verschiedener Disziplinen in die Arbeit mit Korpusdaten, mögliche Fragestellungen sowie die daraus sich ergebenden Anforderungen an die zugrundeliegenden Textkorpora und an Forschungsinfrastrukturen, die diese Korpora bereitstellen, ist daher 
von großer Bedeutung für eine breite und divers interessierte Community.

In einem zweiten Themenblock wird von der praktischen Seite erörtert, wie Text- und Metadaten projektübergreifend zusammengeführt und im usammenhang auswertbar gemacht werden können. Dabei wird es zum einen um Bemühungen hinsichtlich der Formulierung von Standards, die daraus sich ergebenden Konsequenzen für die Datenaufbereitung sowie die Sicherung der Konformität der Daten mit den formulierten Standards gehen. Zum anderen werden bereits implementierte Methoden vorgestellt, um solcherlei homogen aufbereitete Textkorpora und Metadaten entsprechend datenbasierter Fragestellungen auszuwerten.

Die Konferenz geht mit einem CLARIN-D-Workshop zum Arbeitspaket 5 ''Sprachressourcen und Dienste'' einher. Dieser Workshop knüpft an den CLARIN-D/AP5-Workshop vom Januar 2013 an und widmet sich den neuen Entwicklungen im Verbundprojekt CLARIN-D rund um den Aufbau, das Angebot und Möglichkeiten der Auswertung von CLARIN-kompatiblen Sprachressourcen. Dabei werden die in CLARIN verfügbaren Ressourcen, Tools und Services behandelt und die Maßnahmen zur Sicherstellung der homogenen Aufbereitung von Ressourcen (Richtlinien und Schulungseinrichtungen) vorgestellt. 

Program:

Montag, 17 November 2014

CLARIN-D Workshop

9:00–9:30	
Axel Herold (Berlin)	
CLARIN-D-Ressourcen: Was kann ich nutzen, und wie funktioniert das?

9:30–10:00	
Susanne Haaf (Berlin), Bryan Jurish (Berlin) 
Die Vielfalt vereinen: Die CLARIN-Eingangsformate CMDI und TCF

10:00–10:30	
Volker Boehlke (Leipzig)	
„CLARINifizierung“ von Ressourcen – Anforderungen, Beispiele und Erfahrungen

10:30–11:00 Pause

11:00–11:30
Thorsten Trippel (Tübingen)	
Stets zu Diensten: Wenn Textdaten auf Services treffen

1:30–12:00	
Kai Zimmer (Berlin)	
Repositories in CLARIN-D am Beispiel des CLARIN-D-Servicezentrums an der BBAW

12:00–12:30	
Timm Lehmberg (Hamburg)	
Helpdesk für Ressourcen – Ressourcen für den Helpdesk

12:30–13:30 Mittagspause

DTA- & CLARIN-D-Konferenz, Tag 1

13:30–13:45	
Alexander Geyken (Berlin)	
Begrüßung

Themenblock 1: Ressourcengestützte Forschungsfragen, Teil 1

13:45–14:15	
Gregory Crane (Leipzig)	
Getting to Open Greek and Latin

14:15–14:45	
Fotis Jannidis (Würzburg)	
Eine korpusgestützte Geschichte des deutschsprachigen Romans von 1500 bis 1950

14:45–15:15	
Jochen Tiepmar (Leipzig)	
Canonical Text Service und Text Re-Use am Beispiel des DTA-Korpus

15:15–15:45 Pause

15:45–16:15	
Robert Strötgen (Braunschweig)	
Das Korpus digitalisierter historischer Schulbücher von GEI-Digital als Ausgangspunkt geisteswissenschaftlicher Forschungsfragen

16:15–16:45	
Sascha Schroeder (Berlin)	
Textkorpora in der pädagogisch-psychologischen Forschung: Anwendungen und Perspektiven

16:45–17:15	
Achim Saupe (Potsdam)	
Ordnung, Sicherheit und Risiko seit den 1960er Jahren. Perspektiven einer historischen Semantik der Geschichte der Gegenwart

17:15–18:00 Empfang

18:00–18:45	
Norbert Dittmar (Berlin)	
Abendvortrag: Der Fall der Mauer im Spiegel des Berliner Wendekorpus: Soziolinguistische Bedeutung und didaktische Anwendbarkeit

Dienstag, 18 November 2014

DTA- & CLARIN-D-Konferenz, Tag 2

Themenblock 1: Ressourcengestützte Forschungsfragen, Teil 2

9:00–9:30
Britt-Marie Schuster (Paderborn)	
Historische Zeitungskorpora als Materialien einer Geschichte des öffentlichen Kommunizierens: „Die Stats- und gelehrte Zeitung des Hamburgischen 
unpartheyischen Correspondenten“ als Beispiel

9:30–10:00	
Christopher Kolbeck (Regensburg), Kathrin Pindl (Regensburg), Susanne Haaf (Berlin)	
Regensburger Rechnungsbücher interdisziplinär: Wirtschafts- und sprachhistorische Perspektiven

Themenblock 2: Aufbereitung, Zusammenführung und Auswertung von Ressourcen

10:00–10:30	
Elke Teich (Saarbrücken), Christoph Draxler (München), Hannah Kermes (Saarbrücken)
Kontextualisierung von Sprachressourcen und -technologie in der geisteswissenschaftlichen Forschung

10:30–11:00 Pause

11:00–11:30	
Peter Fankhauser (Mannheim)	
Generative bayes'sche Modelle zur explorativen Analyse eines historischen Zeitungskorpus

11:30–12:00	
Kay-Michael Würzner (Berlin)	
Die Integration von OCR-erfassten Texten in das Deutsche Textarchiv am Beispiel der Zeitschrift „Die Grenzboten“ (1841–1922)

12:00–12:30	
Michael Beißwenger (Dortmund), Lothar Lemnitzer (Berlin)	
Deutsches Referenzkorpus zur internetbasierten Kommunikation – Fragen der Standardisierung und Datenerhebung

12:30–13:30 Pause

13:30–14:00	
Jonas Kuhn (Stuttgart), André Blessing (Stuttgart)	
Computerlinguistische Techniken und Textanalyse jenseits der grammatischen Struktur

14:00–14:30	
Bryan Jurish (Berlin)	
Semantics, Similarity and Corpus Search in the Deutsches Textarchiv

14:30–15:00	
Stefan Dumont (Berlin)	
correspSearch – Briefeditionen vernetzen

15:00–15:30	
Dieter van Uytvanck (Nijmegen)	
Auf der Suche nach Sprachressourcen: CLARINs Virtual Language Observatory

----------------------------------------------------------
LINGUIST List: Vol-25-4277	
----------------------------------------------------------
Visit LL's Multitree project for over 1000 trees dynamically generated
from scholarly hypotheses about language relationships:
          http://multitree.linguistlist.org/