Date: 31-May-2024
From: Ilia Afanasev [ilia.afanasev at univie.ac.at]
Subject: Workshop Digitale Slawistik im Rahmen der 48. Österreichischen Linguistik-Tagung
Full Title: Workshop Digitale Slawistik im Rahmen der 48.
Österreichischen Linguistik-Tagung
Date: 17-Dec-2024 - 19-Dec-2024
Location: Innsbruck, Austria
Contact Person: Ilia Afanasev
Meeting Email: digitalslawistik at gmail.com
Linguistic Field(s): Computational Linguistics; General Linguistics;
Historical Linguistics
Language Family(ies): Slavic Subgroup
Call Deadline: 01-Jul-2024
Meeting Description:
(English description below)
Mit dem Eintritt in die Big-Data-Ära des 21. Jahrhunderts haben sich
die Forschungsmöglichkeiten und -methoden innerhalb der Geistes- und
Sozialwissenschaften signifikant verändert. Das Training von Large
Language Models (LLM) und die Entwicklung von Transformern wie BERT
oder der GPT- Familie beeinflussen alle linguistischen Bereiche,
insbesondere die Verarbeitung natürlicher Sprache (NLP), und die
slawistische Linguistik ist hier keine Ausnahme. Das Ziel dieses
Workshops ist es, die Auswirkungen von LLMs auf die Fragestellungen
und Arbeitsweisen innerhalb der slawistischen Forschung auszuloten.
Since the beginning of the 21st century, Big Data has reshaped
research possibilities and methods in humanities and Social Sciences.
The emergence of transformer neural networks, such as BERT, and the
subsequent rise of Large Language Models (LLM) transformed all
linguistic branches, especially Natural Language Processing (NLP).
Slavic studies are not an exception. This workshop aims to explore the
impact of LLMs on the problems and working methods within Slavic
Call for Papers:
(see English version below)
Dabei sind Beiträge zur Anwendung der neuen digitalen Methoden in der
Slawistik (besonders der Transformer-Netzwerke und LLM) ebenso
willkommen wie traditionelle Methoden (etwa die regelbasierte
Lemmatisierung oder Wortart-Tagging), interdisziplinäre Arbeiten oder
die kritische Auseinandersetzung mit den Möglichkeiten und Grenzen
digitaler Methoden. Mögliche Vortrags und Diskussionsthemen zur
Anwendung digitaler Methoden sind:
* Auf- und Ausbau von Korpora und Datenbanken für historische und
moderne Sprachvarietäten
* Diastratische, diatopische, diachrone und areallinguistische
Dokumentations- und Darstellungsformen
* Entwicklung von Toolkits für die Digitalisierung und Annotation
slawischen Sprachmaterials: POS-und morphologisches Tagging,
Lemmatisierung, Abhängigkeitsanalyse
* Korpusbasierte und korpusgestützte Analyse
* Maschinelle Übersetzungen für slawische Sprachen
* Stylometrie, Klassifikation und Text-Networks-Analysis
* Verarbeitung historischer Dokumente: HTR und bildgebende Verfahren
(Pre- und Postprocessing, Modelltraining)
* Textkritik
* Benchmarks für slawische NLP
* Regelbasierte Ansätze und KI
* Grenzen und Desiderata
Präsentationssprache ist Deutsch oder Englisch.
Einreichungsfrist der Abstracts:
01 Juli 2024 (UTC+2, CET)
Wir bitten um Zusendung der Abstracts (nicht mehr als 1 A4-Seite,
Times New Roman 12, einzeilig, exklusive Beispiele und
Literaturangaben) an digitalslawistik at gmail.com.
This panel seeks contributions on novel digital methods (especially
transformer networks and LLM) as well as on traditional approaches
(such as rule-based lemmatisation or part-of-speech tagging) within
Slavic Studies, on the interdisciplinary exploration or on critical
examination of the possibilities and limitations of digital methods.
Among the possible topics are:
* Corpus and database building for historical and modern language
* Digital documentation and representation of areal phenomena, as well
as social, historical, and regional variation
* Development of toolkits for digitisation and tagging of Slavic
languages: POS- and morphological tagging, lemmatisation, dependency
* Corpus-based analysis
* Machine translation for Slavic languages
* Stylometry, classification and text network analysis
* OCR and processing of historical documents: pre- and
post-processing, model training
* Textual criticism
* Benchmarks for Slavic NLP
* Rule-based approaches and AI
* Limits and desiderata
Presentations should be in German or English.
Deadline for abstract submission:
01 July 2024 (UTC+2, CET)
Please send your abstracts (no more than 1 A4 page, Times New Roman
12, single-spaced, excluding examples and references) to
digitalslawistik at gmail.com.
