36.3023, Calls: Korpora Deutsch als Fremdsprache - "Tücken und Potenziale automatischer Verfahren der Erschließung und Analyse von (nicht schriftlich-standardsprachlichen) Korpora deutscher Varietäten" (Jrnl)

The LINGUIST List linguist at listserv.linguistlist.org
Wed Oct 8 09:05:02 UTC 2025


LINGUIST List: Vol-36-3023. Wed Oct 08 2025. ISSN: 1069 - 4875.

Subject: 36.3023, Calls: Korpora Deutsch als Fremdsprache - "Tücken und Potenziale automatischer Verfahren der Erschließung und Analyse von (nicht schriftlich-standardsprachlichen) Korpora deutscher Varietäten" (Jrnl)

Moderator: Steven Moran (linguist at linguistlist.org)
Managing Editor: Valeriia Vyshnevetska
Team: Helen Aristar-Dry, Mara Baccaro, Daniel Swanson
Jobs: jobs at linguistlist.org | Conferences: callconf at linguistlist.org | Pubs: pubs at linguistlist.org

Homepage: http://linguistlist.org

Editor for this issue: Valeriia Vyshnevetska <valeriia at linguistlist.org>

================================================================


Date: 08-Oct-2025
From: Jana Gamper [jana.gamper at germanistik.uni-giessen.de]
Subject: Korpora Deutsch als Fremdsprache - "Tücken und Potenziale automatischer Verfahren der Erschließung und Analyse von (nicht schriftlich-standardsprachlichen) Korpora deutscher Varietäten" (Jrnl)


Journal: Korpora Deutsch als Fremdsprache
Issue: Tücken und Potenziale automatischer Verfahren der Erschließung
und Analyse von (nicht schriftlich-standardsprachlichen) Korpora
deutscher Varietäten
Call Deadline: 15-Dec-2025

Themenheft der Zeitschrift Korpora Deutsch als Fremdsprache (KorDaF)
Herausgeber:innen des Hefts: Matthias Schwendemann, Katrin Wisniewski,
Jana Gamper
Die Korpuslinguistik hat von jeher eine besonders enge Bindung an die
automatisierte technische Erschließung von Sprache, wie sie von
Sprachtechnologie und Computerlinguistik geleistet wird. Die
Aufbereitung und Speicherung von Korpora ist genau wie die Suche in
Korpora ohne entsprechende digitale Tools nicht denkbar. Insbesondere
die automatische Wortarten- und Syntaxanalyse ist seit langem fest
etabliert (POS-Tagging und Parsing) und funktioniert vor allem in
schriftlichen, standardsprachlichen bzw. sehr standardnahen
zielsprachlichen Korpora so gut, dass sie kaum mehr „der Rede wert“
erscheint. Allerdings gilt dies eben nur für einen begrenzten
Ausschnitt des sprachlichen Varietätenraums.
Herausfordernder ist die Anwendung solcher und vieler anderer
automatischer Analyseschritte bereits bei gesprochensprachlichen, v.a.
bei medial und konzeptionell mündlichen Korpora, bei
gebärdensprachlichen, historischen und ganz besonders auch bei
Lernerkorpora, mit anderen Worten bei nicht schriftlichen und/oder
nicht standardsprachlichen Korpora. Hier treten – für Mensch und
Maschine gleichermaßen – regelmäßig fundamentale Schwierigkeiten schon
bei der basalen Erschließung (z.B. Segmentierung) auf. Gerade die
variable deutsche Syntax führt zu hohen Fehlerquoten, wenn etwa
Lernersprache direkt automatisch geparst wird – ein Faktum, das in der
entsprechenden germanistischen, internationalen
lernerkorpuslinguistischen, aber auch der NLP-Literatur kaum
Aufmerksamkeit erfährt, aber gravierende Konsequenzen für die
Belastbarkeit aller empirischen Studien bergen könnte, die auf solchen
Analysen beruhen. Teils verfolgen insbesondere im deutschsprachigen
Raum entsprechende Korpusprojekte deshalb verschiedene
Normalisierungsstrategien als Zwischenschritte und Umwege bei der
Korpusaufbereitung, bislang vorwiegend manuell (z.B. Zielhypothesen).
Auch schon die manuelle Aufbereitung stark von standardsprachlichen
Normen abweichender Korpora erfordert immer wieder nicht nur
linguistisch sehr gut fundierte Entscheidungen, sondern beinhaltet
zwangsläufig auch Deutungen, mehrdeutige Entscheidungen und natürlich
Fehler. Kommen automatische Verfahren zum Einsatz, bergen gerade
komplexe Korpusdesigns die Gefahr kaskadierender Fehlerketten (vgl.
Shadrova et al., 2025).
Unter anderem solche Einschränkungen der automatisierten technischen
Verarbeitung verhindern bislang wohl die Erstellung großer nicht
schriftlich-standardsprachlicher Korpora, die dringend benötigt
würden, um die gerade hier sehr große Abhängigkeit von 2
unterschiedlichen Variationsfaktoren (z.B. Register,
Erhebungskontexte, Aufgabenformate, Hintergrundsprachen usw.)
überhaupt erst zu verdeutlichen.
Gleichzeitig bietet die anrollende KI-Transformation zweifelsohne ganz
neue Ansatzpunkte und Potenziale für die Integration automatischer
Verfahren in die Arbeit mit solchen „nicht
schriftlich-standardsprachlichen“ Korpora.
Angesichts dieser Lage – vielleicht sogar an einem Wendepunkt - widmet
sich dieser Themenschwerpunkt folgenden (und verwandten) Fragen und
Herausforderungen:
 - innovative Ansätze bei der automatischen Transkription,
Segmentierung, Annotation und Analyse von nicht
schriftlich-standardsprachlichen Korpora aller Art, insbesondere, aber
nicht ausschließlich KI-basiert
 - spezifische Herausforderungen der Automatisierung hinsichtlich
  - konkreter Automatisierungsschritte (z.B. Transkription,
Segmentierung),
  - bestimmter Korpustypen (z.B. minderheitensprachliche Korproa)
und/oder
  - spezifischen sprachlichen Gegenständen (z.B. automatische
Annotation diskurs- oder interaktionsbezogene Phänomene in
gesprochenen Korpora)
 - empirische Analysen zur Güte automatischer Verarbeitungsschritte
 - Entwicklung neuer automatisierter Korpuszugänge, insbesondere
KI-basiert, zu (nicht-kanonischen) und anderen Korpora
 - technische Standards der Automatisierung (z.B. Formate,
Metadaten….)
 - automatische Korpusanalyse im Kontext von Open Science
 - Ineinanderwirken unterschiedlicher Tools
Praktische Informationen:
Geplantes Erscheinungsdatum: Heft 1/2027
Wir bitten um die Einreichung eines aussagekräftigen Abstracts (1
Seite) bis zum 15. Dezember 2025 an katrin.wisniewski at uni-leipzig.de
Rückmeldung bis Ende Januar 2026
Erstellung der Beiträge bis Ende September 2026
Erscheinen KorDaF, Heft 1/2027
Stylesheet für die Beiträge online unter:
https://kordaf.tujournals.ulb.tu-darmstadt.de/
Die Beiträge werden einem doppelblinden Peer-Review-Verfahren mit zwei
externen Gutachter:innen unterzogen. KorDaF erscheint im Open Access
und ist verfügbar unter:
https://kordaf.tujournals.ulb.tu-darmstadt.de/

Linguistic Field(s): Applied Linguistics
                     Computational Linguistics
                     Text/Corpus Linguistics

Subject Language(s): German (deu)




------------------------------------------------------------------------------

********************** LINGUIST List Support ***********************
Please consider donating to the Linguist List, a U.S. 501(c)(3) not for profit organization:

https://www.paypal.com/donate/?hosted_button_id=87C2AXTVC4PP8

LINGUIST List is supported by the following publishers:

Bloomsbury Publishing http://www.bloomsbury.com/uk/

Cambridge University Press http://www.cambridge.org/linguistics

Cascadilla Press http://www.cascadilla.com/

De Gruyter Brill https://www.degruyterbrill.com/?changeLang=en

Edinburgh University Press http://www.edinburghuniversitypress.com

John Benjamins http://www.benjamins.com/

Language Science Press http://langsci-press.org

MIT Press http://mitpress.mit.edu/

Multilingual Matters http://www.multilingual-matters.com/

Narr Francke Attempto Verlag GmbH + Co. KG http://www.narr.de/

Netherlands Graduate School of Linguistics / Landelijke (LOT) http://www.lotpublications.nl/

Peter Lang AG http://www.peterlang.com


----------------------------------------------------------
LINGUIST List: Vol-36-3023
----------------------------------------------------------



More information about the LINGUIST mailing list