Ressources: corpus CO2 de parole spontanee annotee en co-reference

Thierry Hamon thierry.hamon at UNIV-PARIS13.FR
Wed Jun 12 19:43:32 UTC 2013


Date: Mon, 10 Jun 2013 20:31:04 +0200
From: Jean Yves ANTOINE <Jean-Yves.Antoine at univ-tours.fr>
Message-ID: <51B61B68.2070502 at univ-tours.fr>
X-url: http://www.info.univ-tours.fr/~antoine/parole_publique/CO2/index.html


 =======================================================================
Sortie de CO2 : corpus libre de dialogue oral annoté en coréférences et 
anaphores associatives
 =======================================================================

Le Laboratoired'Informatique (LI) de l'Université de Tours et le
Laboratoire Ligérien de Linguistique (LLL) de l'Université d'Orléans ont
le plaisir de vous annoncer la sortie du corpus CO2, diffusé librement
auprès de tous sous licence Creative Commons CC-BY-NC-SA.Ce corpus est
constitué d'un extrait du corpus oral ESLO1 (connu souvent sous le nom
de "corpus d'Orléans") qui a été annoté en coréférencesnominales et
pronominales. L'annotation distingue coréférences directes, indirectes,
pronominales mais également anaphores associatives.L'annotation est
déportée et a été réalisée à l'aide du logiciel libreGLOZZ développé par
le GREYC (http://www.glozz.org/)

Financé par les universités de Tours et d'Orléans, membres du PRES
Centre Val de Loire, le corpus représente 3h28 d'enregistrement et 35192
mots. Il constitue une mise en bouche avant la sortie du corpus ANCOR,
réalisé par les deux mêmes laboratoires et qui suit les mêmes
conventions d'annotation. Comprenant 453000 mots, ce corpus sera
présenté au prochaincongrès TALN et rendu disponible, toujours sous
lamême licence, en septembre 2013.

Dans l'immédiat, vous pouvez déjà découvrir et récupérer le corpus CO2 
sur le site Parole Publique : 
http://www.info.univ-tours.fr/~antoine/parole_publique/CO2/index.html 

------------------------------------------------------------------------
Contacts : Jean-Yves.Antoine at univ-tours.fr ou 
Emmanuel.Schang at univ-tours.fr (concepteurs du corpus)
Annotations : Judith Muzerelle et Aurore Pelletier

Rappel : le corpus ESLO (audio + transcriptionsorthographique) est par
ailleurs diffusé librement également sous licence CC-BY-NC-SA.

-------------------------------------------------------------------------
Message diffuse par la liste Langage Naturel <LN at cines.fr>
Informations, abonnement : http://www.atala.org/article.php3?id_article=48
English version       : 
Archives                 : http://listserv.linguistlist.org/archives/ln.html
                                http://liste.cines.fr/info/ln

La liste LN est parrainee par l'ATALA (Association pour le Traitement
Automatique des Langues)
Information et adhesion  : http://www.atala.org/
-------------------------------------------------------------------------



More information about the Ln mailing list