[ln] Info: Corpus oral C-ORAL-ROM (4 langues romanes) disponible

Thierry Hamon thierry.hamon at LIPN.UNIV-PARIS13.FR
Fri Jan 21 10:17:30 UTC 2005


Date: Thu, 20 Jan 2005 21:41:28 +0100
From: Jean Veronis <Jean.Veronis at up.univ-mrs.fr>
Message-ID: <41F01778.6090805 at up.univ-mrs.fr>
X-url: http://www.elda.org/
X-url: http://www.elda.org/catalogue/fr/speech/S0172.html
X-url: http://aixtal.blogspot.com


Le corpus C-ORAL-ROM est disponible chez Elra/Elda
<http://www.elda.org/>. <http://www.elda.org/catalogue/fr/speech/S0172.html>

C-ORAL-ROM est un corpus multilingue de parole spontanée pour les
principales langues romanes composé d'environ 1 200 000 mots (IST
2000-26228). Le corpus est composé de quatre collections
d'enregistrements comparables de sessions de parole spontanée pour
l'italien, le français, le portugais et l'espagnol (environ 300 000
mots par langue). Les collections ont été fournies par les organismes
suivants :

    * Università di Firenze (Dipartimento di Italianistica, LABLITA);
    * Université de Provence (DELIC, Description Linguistique
      Informatisée sur Corpus);
    * Fundação da Universidade de Lisboa/Centro de Linguística da
      Universidade de Lisboa
    * Universidad Autónoma de Madrid (Departamento de Lingüística,
      Lenguas Modernas, Lógica y F. de la Ciencia, Laboratorio de
      Lingüística Informática).

Le corpus C-ORAL-ROM offre la source acoustique de chaque session
ainsi que les annotations principales suivantes :

    * La transcription orthographique, au format CHAT, enrichie de
      l'étiquetage des pauses prosodiques terminales et non terminales
    * Un metadata des sessions
    * La synchronisation du texte par rapport à la parole, au format WIN
      PITCH CORPUS, basée sur l'alignement de chaque occurrence transcrite.

Voir détails :
http://www.elda.org/catalogue/fr/speech/S0172.html


--jv
  Blog des Technologies du langage : http://aixtal.blogspot.com

-------------------------------------------------------------------------
Message diffusé par la liste Langage Naturel <LN at cines.fr>
Informations, abonnement : http://www.biomath.jussieu.fr/LN/LN-F/
English version          : http://www.biomath.jussieu.fr/LN/LN/
Archives                 : http://listserv.linguistlist.org/archives/ln.html

La liste LN est parrainée par l'ATALA (Association pour le Traitement
Automatique des Langues)
Information et adhésion  : http://www.atala.org/
-------------------------------------------------------------------------



More information about the Ln mailing list