Call for participation: Tools and Research based on Language Acquisition Corpora (Paris, France)
Appel à participation (entrée libre)
Outils et Recherches pour les Corpus d’Acquisition du Langage
Tools and Research based on Language Acquisition Corpora
Version française (see English version below)
Outils et Recherches pour les Corpus d’Acquisition du Langage
18-18 Novembre 2010, PARIS, FRANCE
Lieu : 59 rue Pouchet, 75017 PARIS
Contact : cparisse at
Les corpus de langues orales ou signées sont aujourd’hui largement utilisés
dans les recherches sur l’acquisition du langage. Cette évolution a
nécessité de nouveaux outils, de nouvelles pratiques de recherche et de
nouvelles théories qui ont amené des changements majeurs dans les recherches
en linguistique et en acquisition du langage. Il est nécessaire de partager
et diffuser auprès des chercheurs et des étudiants les résultats, les
techniques et les transformations récentes qui résultent de cette évolution.
En effet, ces produits viennent d’un effort collectif qu’il faut encourager
et amplifier afin d’arriver à encore mieux créer, utiliser, partager,
diffuser les données de corpus de langage spontané. C’est en utilisant mieux
les outils et corpus récents que la recherche, nationale et internationale,
pourra s’enrichir et prospérer.
Pour cela, un workshop incluant des tutoriels et des présentations sur les
outils et la recherche utilisant les corpus d’acquisition de langage sera
organisé par le GDR « Langues, langage oral et cognition : acquisition et
dysfonctionnements – nouvelles approches » et financé par le CNRS. Ce
workshop est conçu pour :
* présenter et introduire des outils utilisés fréquemment pour créer
et éditer des corpus de langage oral (langues orales ou signées). Un
tutoriel concernera les usages avancés des corpus ;
* présenter et discuter les évolutions en matière d’outils pour corpus
de langage oral ;
* présenter et discuter l’intérêt et les apports des recherches
utilisant des corpus de langage oral.
Jeudi 18 novembre 2010 (Tutoriels)
* Présentation et introduction aux logiciels CLAN, ELAN, PHON ;
transcription et utilisation pour la recherche. Les présentations se
focaliseront sur les principes de bases et fourniront des exemples de
recherches effectivement menées avec ces outils. Elles seront organisées
sous forme de tutoriels et seront ouvertes à des utilisateurs novices. Les
tutoriels dureront 1h1/2 et il sera possible d’assister à l’ensemble des
* CLAN (Stéphanie Caet, Prismes – Sorbonne Nouvelle Paris 3).
* ELAN (Simon Harrison, Natural Media & Engineering, Aachen
* PHON (Naomi Yamaguchi, LPP – Sorbonne Nouvelle Paris 3, SFL –
CNRS-Paris 8).
* Présentation d’utilisation de corpus déjà existants : comment
traiter ces corpus, comment réaliser des statistiques, comment réaliser une
analyse syntaxique ou lexicale. Cette présentation sera également réalisée
sous la forme d’un tutoriel et visera plutôt des utilisateurs avancés,
utilisant CLAN ou d’autres logiciels.
* Christophe Parisse (MoDyCo-INSERM, CNRS-Université Paris Ouest
* L’organisation de ces tutoriels pourra évoluer en fonction du nombre
de personnes intéressées. Pour cela, toute personne intéressée par ces
tutoriels doit écrire à Christophe Parisse (cparisse at pour se
préinscrire. Le nombre de places disponibles sera limité.
Vendredi 19 novembre 2010 (Workshop)
* Matin : Nouvelles tendances et évolutions dans les outils et les
corpus de langage oral, annotation et traitement des corpus. Comment est-il
possible d’utiliser efficacement des outils pour travailler sur
l’acquisition du langage oral ? Quels avantages ces outils offrent-ils pour
la recherche ? Quelles améliorations attendre en particulier dans le
traitement de corpus multimédia et de langage oral ? Est-ce que les outils
actuels vont évoluer ou de nouveaux outils vont-ils se développer ? Des
présentations sur ces thèmes seront réalisés par :
* Han Sloetjes (Max Planck Institute for Psycholinguistics, Nijmegen,
* Michael Kipp (Saarland University, ANVIL).
* Thomas Schmidt (Universität Hamburg, EXMARaLDA).
* Après-midi : Nouvelles tendances dans les recherches en acquisition
du langage. Qu’est-ce que l’utilisation de corpus a apporté aux recherches
en acquisition du langage ? Comment ont évolué les liens entre recherche
théorique et applications pratiques ? Des présentations seront réalisées par
des invités sur des thèmes allant de la création de données de corpus à
l’utilisation de ces données pour la recherche en acquisition du langage ou
en linguistique computationnelle :
* Elena Lieven (University of Manchester, UK; Max Planck Leipzig,
* Susanne Miyata (Faculty of Health and Medical Sciences, Aichi,
* Heidi Waterfall (Cornell University, NY).
Le workshop et les tutoriels se dérouleront à Paris, au Laboratoire SFL (UMR
7023, CNRS), 59 rue Pouchet, PARIS.
Comité d’organisation :
Christophe Parisse (Modyco, INSERM, Nanterre, France)
Aliyah Morgenstern (Prismes, Université Sorbonne Nouvelle, Paris, France)
Maya Hickmann (SFL, CNRS-Paris 8, Paris, France)
Financé par le GDR CNRS « Langue, Langage Oral et Cognition: acquisition et
dysfonctionnements - nouvelles approches », responsable Maya Hickmann.
Tools and Research based on Language Acquisition Corpora
November 18-19 2010, PARIS (FRANCE)
Location: 59 rue Pouchet, 75017 PARIS (FRANCE)
Contact: Christophe Parisse cparisse at
Multimodal language corpora of spoken and signed languages are now widely
and extensively used in language acquisition studies. This has required new
tools, new research practices, new theories which has brought about ground
breaking changes in research in linguistics and in psycholinguistics. These
recent transformations, techniques and results need to be shared with a
large community of researchers and students in the field of language
acquisition. Creating, using, sharing, analyzing spontaneous oral data with
the relevant tools for each researcher’s specific needs can only help
improve and enrich national and international research on language
acquisition, and collective efforts are needed to attain this goal.
A Workshop including tutorials and various presentations, will be organized
by the GDR “Language, oral language and cognition: Language acquisition –
new approaches” and funded by the CNRS. This workshop is designed to:
* present and provide introductions to tools used for creating and
analyzing corpora of spontaneous oral (spoken and signed) language (separate
tutorials will target beginners and advanced corpora users);
* present and discuss trends about tools for oral language data;
* present and discuss trends about research using oral language
Thursday, November 18th 2010 (Tutorials)
* Introductory presentations and examples of researches conducted
using CLAN, ELAN, PHON. Presentations will focus on the basic requirements
when using these tools and provide examples of actual research conducted
with these tools. They will be organized as tutorials to provide basic
information to new users. Three 1h ½ tutorials will be organized so that it
will be possible to attend all tutorials.
* CLAN (Stéphanie Caet, Prismes – Sorbonne Nouvelle Paris 3).
* ELAN (Simon Harrison, Natural Media & Engineering, Aachen
* PHON (Naomi Yamaguchi, LPP – Sorbonne Nouvelle Paris 3, SFL –
CNRS-Paris 8).
* Presentation on using existing corpora: how to process them, how to
obtain statistical results, how to generate syntactic and lexical analyses.
This presentation will also be organized as a tutorial but will focus on
more advanced users, for CLAN and other software.
* Christophe Parisse (MoDyCo-INSERM, CNRS-Université Paris Ouest
* The organization of the tutorials may change according to the number
of people interested. Please send an e-mail to Christophe Parisse
(cparisse at to make a pre-registration.
Friday, November 19th 2010 (Workshop)
* Morning: New trends about tools for oral language corpus annotation
and processing. How is it possible to use tools for research on Language
Acquisition Corpora efficiently? What do these tools offer to the
researcher? Which improvements, which changes are of interest to work with
oral and multimodal language corpus? Will existing tools evolve or new tools
develop? Invited speakers are:
* Han Sloetjes (Max Planck Institute for Psycholinguistics, Nijmegen,
* Michael Kipp (Saarland University, ANVIL),
* Thomas Schmidt (Universität Hamburg, EXMARaLDA).
* Afternoon: New trends in language acquisition research. What does
corpus analysis bring to language acquisition research? How has it changed
the relationship between theoretical and applied work? Invited speakers are:
* Elena Lieven (University of Manchester, UK; Max Planck Leipzig,
* Susanne Miyata (Faculty of Health and Medical Sciences, Aichi,
* Heidi Waterfall (Cornell University, NY).
The workshop will be held in Paris, at the SFL Lab (UMR 7023, CNRS), 59 rue
Pouchet, Paris, FRANCE.
Organizing committee:
Christophe Parisse (Modyco, INSERM, Nanterre, France)
Aliyah Morgenstern (Prismes, Sorbonne Nouvelle University, Paris, France)
Maya Hickmann (SFL, CNRS-Paris 8, Paris, France)
Funded by the CNRS, GDR « Langue, Langage Oral et Cognition: acquisition et
dysfonctionnements - nouvelles approches », scientific director Maya
