[Corpora-List] Dernier appel =?iso-8859-1?Q?=E0_communication_-_Journ=E9e_d'=E9tude_?=annotation corpus oraux, Paris

Christophe Benzitoun Christophe.Benzitoun at univ-nancy2.fr
Wed Oct 17 09:48:44 UTC 2012


*Annotation syntaxique de corpus oraux*

*Projets récents et perspectives*

**

**

Appel à communication

Journée d'étude Conscila (ENS Paris)

*Vendredi 7 décembre 2012*

À l'heure actuelle, de plus en plus de corpus de français parlé sont 
librement mis à la disposition de la communauté scientifique (corpus 
PFC, Corpus du Français Parlé Parisien, Valibel, CRDO, TCOF, etc.). Or, 
ces données présentent des particularités non prises en compte par la 
plupart des outils de traitements de corpus. Ainsi, il est difficile 
d'employer ces instruments directement sur le français parlé. De même, 
les données issues de l'oral posent des problèmes pour leur intégration 
dans les cadres traditionnels. Les logiciels et les approches 
linguistiques ont pour point commun d'avoir été principalement 
développés à partir de textes écrits (ou à partir d'exemples inventés) 
et en vue du traitement de l'écrit. Ainsi, afin d'adapter les systèmes 
actuels ou, tout simplement, d'approfondir notre connaissance du 
français, il est indispensable de produire des annotations sur les 
ressources orales.

Cependant, les initiatives dans ce domaine en sont encore au stade 
embryonnaire pour le français, même s'il en existe tout de même un 
nombre conséquent. On peut citer les travaux de Eshkol et al. (2010), le 
projet PERCEO (http://cnrtl.fr/corpus/perceo/) -- tous deux sur 
l'annotation morphosyntaxique -- la récente journée ATALA /Annoter les 
corpus oraux/ (Paris, avril 2011), le projet CID à Aix-en-Provence 
(http://sldr.org/sldr000027), une partie du projet ANR /Colaje/ (chez 
les jeunes enfants ; http://colaje.risc.cnrs.fr/), le projet SYFRAP 
(http://talc.loria.fr/HOME,288.html) ou encore l'école thématique CNRS 
sur l'annotation de données langagières (sept. 2011). Pour la syntaxe 
plus spécifiquement, on peut, entre autres, signaler le projet FNRS de 
L. Degand et A.-C. Simon (2011-2013) portant sur la /Périphérie gauche 
des unités de discours /ainsi que le projet ANR Rhapsodie (2008-2012) 
sous la direction d'A. Lacheret. Un nouveau projet ANR ORFEO (Outils et 
Recherches sur le Français Ecrit et Oral) de constitution et 
d'annotation de corpus va également démarrer début 2013 sous la 
direction de J.-M. Debaisieux. Malgré ces travaux, à l'heure actuelle, 
aucun corpus de français parlé annoté en syntaxe n'est disponible, à 
notre connaissance.

L'un des objectifs de cette journée thématique sera de faire le point 
sur les initiatives récentes, en cours et futures dans le domaine de 
l'annotation syntaxique de corpus de français parlé, en montrant 
notamment comment l'annotation systématique fait émerger des questions 
fondamentales pour la description du français en général. Il s'agira 
également de voir dans quelle mesure on peut/doit développer de nouveaux 
modèles et outils pour intégrer les phénomènes présents à l'oral. Les 
communications pourront aussi bien porter sur des protocoles 
d'annotation, des outils que des études ciblées, des problèmes 
rencontrés, etc., et soulèveront une série de questions : quel standard 
d'annotation pour l'oral ? De quels outils dispose-t-on pour exploiter 
les annotations ? Etc. Par ailleurs, les démonstrations de logiciels 
pour l'annotation/exploitation seront aussi les bienvenues.

La journée se terminera par une table ronde, à laquelle tous les 
participants seront invités, et qui devrait permettre à la fois de faire 
une synthèse des présentations mais aussi de lister quelques-unes des 
bonnes pratiques et de lancer des pistes à explorer dans le cadre de 
projets futurs.*/
/*

*/Organisation/*

Christophe Benzitoun -- ATILF CNRS & Université de Lorraine

Noalig Tanguy -- Lattice UMR 8094 ENS/Paris 3 & Valibel / Université 
Catholique de Louvain

*//*

*/Comité scientifique/*

Frédéric Béchet (Aix-Marseille Université / LIF UMR 7279)

Marie-José Béguelin (Université de Neuchâtel)

Alain Berrendonner (Université de Fribourg)

Mireille Bilger (Université de Perpignan)

Sandrine Caddéo (Aix-Marseille Université / Laboratoire Parole et 
Langage UMR 7309)

Paul Cappeau (Université de Poitiers)

Christophe Cerisara (Loria UMR 7503)

Jeanne-Marie Debaisieux (Université Paris 3 Sorbonne Nouvelle / Lattice 
UMR 8094)

Liesbeth Degand (Université catholique de Louvain / Valibel)

José Deulofeu (Aix-Marseille Université / LIF UMR 7279)

Anne Dister (Facultés universitaires Saint-Louis, Bruxelles)

Iris Eshkol (Université d'Orléans / Laboratoire Ligérien Linguistique 
UMR 7270)

Françoise Gadet (Université Paris Ouest Nanterre La Défense / Modyco UMR 
7114)

Kim Gerdes (Université Paris 3 Sorbonne Nouvelle / LPP / Institut 
d'Automation / Académie de Sciences Chinoise)

Eva Havu (Université de Helsinki)

Sylvain Kahane (Université Paris Ouest Nanterre La Défense / Modyco UMR 
7114)

Anne Lacheret (Université Paris Ouest Nanterre La Défense / Modyco UMR 7114)

Florence Lefeuvre (Université Paris 3 Sorbonne Nouvelle / Clesthia)

Michel Pierrard (Université Libre de Bruxelles)

Paola Pietrandrea (Université Roma Tre / Lattice UMR 8094)

Thierry Poibeau (Lattice UMR 8094 ENS/Paris 3)

Sophie Prévost (Lattice UMR 8094 ENS/Paris 3)

Nathalie Rossi-Gensane (Université Toulouse 2 / CLLE ERSS UMR 5263)

Frédéric Sabio (Aix-Marseille Université / Laboratoire Parole et Langage 
UMR 7309)

Catherine Schnedecker (Université de Strasbourg / Lilpa)

Anne-Catherine Simon (Université catholique de Louvain / Valibel)

Sandra Teston-Bonnard (Université de Lyon 2 / ICAR UMR 5191)

Véronique Traverso (ICAR UMR 5191)

Dan Van Raemdonck (Université Libre de Bruxelles)

Dominique Willems (Université de Gand)

Les propositions de communication (de deux pages maximum, bibliographie 
comprise), en français ou en anglais, sont à adresser *avant le 20 
octobre* aux adresses suivantes : Christophe.Benzitoun at univ-lorraine.fr/ 
noalig.tanguy at uclouvain.be

-------------- next part --------------
An HTML attachment was scrubbed...
URL: <http://listserv.linguistlist.org/pipermail/corpora/attachments/20121017/427f878f/attachment.htm>
-------------- next part --------------
_______________________________________________
UNSUBSCRIBE from this page: http://mailman.uib.no/options/corpora
Corpora mailing list
Corpora at uib.no
http://mailman.uib.no/listinfo/corpora


More information about the Corpora mailing list