Ressource: Rhapsodie, un Treebank prosodique et syntaxique de fran=?ISO-8859-1?Q?=E7ais_?=parle / Rhapsodie: a Prosodic and Syntactic Treebank for Spoken French

Thierry Hamon thierry.hamon at UNIV-PARIS13.FR
Fri Oct 4 20:26:29 UTC 2013


Date: Wed, 2 Oct 2013 12:57:13 +0300
From: Atanas Tchobanov <parisvesti at gmail.com>
Message-ID: <CAKg+smsA59qXhEnh8g3LwbR1hk9TxyTFynm9R1zmtcCrtDOaoQ at mail.gmail.com>
X-url: http://www.projet-rhapsodie.fr/
X-url: http://cfpp2000.univ-paris3.fr/
X-url: http://www.projet-pfc.net/
X-url: http://www.univ-orleans.fr/eslo/

*Avec nos excuses pour les envois multiples*

****

*Rhapsodie: un Treebank prosodique et syntaxique de français parlé*

****

Nous avons le plaisir d'annoncer que la ressource Rhapsodie, Corpus de
français parlé annoté pour la prosodie et lasyntaxe, est désormais
disponible sur http://www.projet-rhapsodie.fr/****

****

Le treebank Rhapsodie est composé de 57 échantillons sonores (5 minutes
en moyenne, au total 3h de parole, 33000 mots) dotés d’une transcription
orthographique et phonétique alignées au son.****

****

Il s'agit d’une ressource de français parlé multi genres (parole privée
et publique ; monologues et dialogues ; entretiens en face à face vs
radiodiffusion, parole plus ou moins interactive et plus ou moins
planifiée, séquences descriptives, argumentatives, oratoires et
procédurales) articulée autour de sources externes (enregistrements
extraits de projets antérieurs, en accord avec les concepteurs initiaux)
et internes. Nous tenons en particulier à remercier les responsables des
projets CFPP2000 (http://cfpp2000.univ-paris3.fr/), PFC
(http://www.projet-pfc.net/), ESLO (http://www.univ-orleans.fr/eslo/),
C-Prom (https://sites.google.com/site/corpusprom/) ainsi que Mathieu
Avanzi, Anne Lacheret, Piet Mertens et Nicolas Obin.****

****

Les échantillons sonores (wave & MP3, pitch nettoyé et lissé), les
transcriptions orthographiques (txt), les annotations macrosyntaxiques
(txt), les annotations prosodiques (xml, textgrid) ainsi que les
metadonnées (xml & html) sont téléchargeables librement selon les termes
de la licence Creative Commons Attribution - Pas d’utilisation
commerciale - Partage dans les mêmes conditions 3.0 France.****

Les annotations microsyntaxiques seront disponibles prochainement.

Les métadonnées sont également explorables en ligne grâce à un browser.

Les tutoriels pour la transcription, les annotations et les requêtes
sont disponibles sur le site Rhapsodie.

Enfin, L’annotation prosodique est interrogeable en ligne grâce au
langage de requêtes Rhapsodie QL.

*L'équipe Ressource Rhapsodie (Modyco, Université Paris Ouest Nanterre)*

Sylvain Kahane, Anne Lacheret, Paola Pietrandrea, Atanas Tchobanov,
Arthur Truong.

*Partenaires *: IRCAM (Paris), LATTICE (Paris), LPL (Aix-en-Provence),
CLLE-ERSS (Toulouse).

************************************************************

*Rhapsodie: a Prosodic and Syntactic Treebank for Spoken French*

We are pleased to announce that *Rhapsodie,* a syntactic and prosodic
treebank of spoken French created with the aim of modeling the interface
between prosody, syntax and discourse in spoken French is now available
at http://www.projet-rhapsodie.fr/****

The Rhapsodie treebank is made up of 57 short samples of spoken French
(5 minutes long on average, amounting to 3 hours of speech and a 33 000
word corpus) endowed with an orthographical phoneme-aligned
transcription . ****

The corpus is representative of different genres (private and public
speech; monologues and dialogues; face-to-face interviews and
broadcasts; more or less interactive discourse; descriptive,
argumentative and procedural samples, variations in planning type).

The corpus samples have been mainly drawn from existing corpora of
spoken French and partially created within the frame of the *Rhapsodie*
project. We would especially like to thank the coordinators of the
CFPP2000 (http://cfpp2000.univ-paris3.fr/), PFC
(http://www.projet-pfc.net/), ESLO (http://www.univ-orleans.fr/eslo/),
C-Prom (https://sites.google.com/site/corpusprom/) projects as well as
Piet Mertens, Mathieu Avanzi, Anne Lacheret and Nicolas Obin.

The sound samples (waves, MP3, cleaned and stylized pitch), the
orthographic transcriptions (txt), the macrosyntactic annotations (txt),
the prosodic annotations (xml, textgrid) as well as the metadata (xml
and html) can be freely downloaded under the terms of the Creative
Commons licence Attribution - Noncommercial - Share Alike 3.0 France.

Microsyntactic annotation will be available soon.

The metadata are searchable on line through a browser.

The prosodic annotation can be explored on line through the Rhapsodie
Query Language.

The tutorials of transcription, annotations and Rhapsodie Query Language
are available on the site.

****

*The Rhapsodie team (Modyco, Université Paris Ouest Nanterre :*

Sylvain Kahane, Anne Lacheret, Paola Pietrandrea, Atanas Tchobanov,
Arthur Truong.

*Partners*: IRCAM (Paris), LATTICE (Paris), LPL (Aix-en-Provence),
CLLE-ERSS (Toulouse).
-------------------------------------------------------------------------
Message diffuse par la liste Langage Naturel <LN at cines.fr>
Informations, abonnement : http://www.atala.org/article.php3?id_article=48
English version       : 
Archives                 : http://listserv.linguistlist.org/archives/ln.html
                                http://liste.cines.fr/info/ln

La liste LN est parrainee par l'ATALA (Association pour le Traitement
Automatique des Langues)
Information et adhesion  : http://www.atala.org/

ATALA décline toute responsabilité concernant le contenu des
messages diffusés sur la liste LN
-------------------------------------------------------------------------



More information about the Ln mailing list