Colloque sur l'annotation du fran=?iso-8859-1?Q?=E7ais_parl=E9=2C_?=Paris, 19-21 juin 2012

Sylvain Kahane sylvain at KAHANE.FR
Wed Jun 6 16:13:23 UTC 2012


Ce colloque de trois jours est organisé par Anne Lacheret, Sylvain Kahane et Paola Pietrandrea pour la cloture du projet ANR Rhapsodie commencé en 2008.
L'objectif de ce projet est l'étude de l'intonosyntaxe du français parlé. Un corpus très richement annoté, le treebank Rhapsodie, sera présenté pendant les journées et mis en ligne à l'issu des journées (je vous enverrai un message quand ça sera en ligne). Il s'agit de 3h de parole (33 000 mots), formés d'une cinquantaine d'échantillons variés, avec pour la prosodie annotations des proéminences, structure prosodique arborescente, contours prosodiques simplifiés et pour la syntaxe, annotation morphosyntaxique, microsyntaxique en dépendance et annotation macrosyntaxique. L'ensemble du corpus est annoté, y compris les portions disfluentes.
Le corpus sera livré avec un système de requètes élaboré et une interface relativement conviviale. L'ensemble du corpus, ainsi qu'une grande partie des outils, seront distribués librement (licence Creative Commons).

Annotation syntaxique et prosodique du français parlé
Autour du treebank Rhapsodie

Mardi 19 juin (Paris 3 Censier, Salle Las Vergnas)

Session 1 : Les livrables Rhapsodie

10h30-10h40 Anne Lacheret : Mots de bienvenu

10H40-11h10 Anne Lacheret, Sylvain Kahane, Paola Pietrandrea : Présentation de la chaine de traitement : de l’annotation au corpus annoté en ligne

11h10-11h40 Arthur Truong : Première démo du corpus en ligne

11h40-12h : Pause café

12h-12h20 Atanas Tchobanov : Présentation du site Rhapsodie

12h20-12h40-Anne Lacheret, Sylvain Kahane, Paola Pietrandrea : Présentation de l’ouvrage sur le treebank Rhapsodie

12h40-13h  Paola Pietrandrea, Anne  Lacheret : Corpus design et métadonnées

13h-14h30 : Déjeuner

Session 3 : Outils pour l’annotation prosodique

14h30-14h50 Anne Dister, Jean-Philippe Goldman : Transcription et alignement

14h50- 15h10  Bernard Victorri : Analor : périodes et proéminences

15h10-15h30 Philippe Martin : Winpitch et nettoyage de la F0

15h30-15h50 : Pause café

Session 4 : Annotation syntaxique

15h50-16h10  Christophe Benzitoun, Frédéric Sabio: Structure macrosyntaxique

16h10-16h30 : Kim Gerdes, Sylvain Kahane : Structure microsyntaxique

16h30-16h50 : Kim Gerdes : Annotation semi-automatique avec Arborator

 

Mercredi 20 juin (Salles des conférences, Bât. B, Paris Ouest Nanterre)

Session 5 : Annotation syntaxique (outils)

10h00-10h20 : Julie Beliao : Du balisage manuel au treebank

10h20- 10h40 : Eric de la Clergerie : Analyse syntaxique automatique avec FRMG

10h40-11h00 : Pause café

Session 6 : Annotation prosodique

11h00-11h20 : Anne Lacheret : Le treebank prosodique de Rhapsodie

11h20-11h40 :  Piet Mertens : Annotation prosodique : de la stylisation aux niveaux de hauteur et aux contours de syllabe

11h40-12h00 : Julie Beliao, Nicolas Obin : Contours globaux

12h00-12h20 : Cédric Gendrot : Durée des syllabes

12h20-14h00 : déjeuner

Session 7 : Treebank et interrogation

14h00-14h20 : Sylvain Kahane, Arthur Truong : Structure du treebank et de la base Rhapsodie

14h20-14h50 : Arthur Truong : Tutoriel sur le langage de requête

14h50-15h40 : Essai en groupe et discussion

15h40-16h00 : Pause café

Session 8 : Exploitation du Treebank

16h00-18h00 : Requêtage sur le Treebank par petits groupes

18h00-19h00 : Retour sur les travaux d’exploitation (10 mn par groupe)

10’ Loiseau, Gerdes, Benzitoun : stats syntaxe

10’ Gendrot, Lacheret, Goldman : stats proso

10’ Martin, Kahane : interface micro-prosodie

10’ Avanzi, Sabio : interface macro-prosodie

10’ Pietrandrea, Beliao : interface prosodie-entassement

 

Jeudi 21 juin (Salles des conférences, Bât. B, Paris Ouest Nanterre)

Session 9 : Bilan Rhaspodie

10h00 -10h30 José  Deulofeu : Bilan annotation macrosyntaxique : En quoi découpe-t-on un texte ?

10h30- 11h00 Anne Lacheret : Annotation prosodique : bilan et perspectives

11h00-11h30 Pause

11h30-12h30 : Anne Lacheret, Sylvain Kahane, Kim Gerdes, Arthur Truong: Retour sur la chaine de traitement : les réussites et les erreurs à ne pas répéter

12h00-13h30 : Déjeuner

Session 10 : Le futur de Rhapsodie

14h00- 14h40 : Atanas Tchobanov, Arthur Truong : Maintenance et mise à jour du site Rhapsodie

14h40-15h00 Pause

15h00-17h00 : Table ronde : Elargissement du treebank Rhapsodie (ajouts d’échantillons, ajouts d’autres couches d’annotation, développement de la plateforme, etc.), dont discussion projet Orfeo (J.-M. Debaisieux)
-------------- next part --------------
An HTML attachment was scrubbed...
URL: <http://listserv.linguistlist.org/pipermail/parislinguists/attachments/20120606/d6805afa/attachment.htm>


More information about the Parislinguists mailing list