Colloque sur l'annotation du fran=?iso-8859-1?Q?=E7ais_parl=E9=2C_?=Paris, 19-21 juin 2012
Sylvain Kahane
sylvain at KAHANE.FR
Wed Jun 6 16:13:23 UTC 2012
Ce colloque de trois jours est organisé par Anne Lacheret, Sylvain Kahane et Paola Pietrandrea pour la cloture du projet ANR Rhapsodie commencé en 2008.
L'objectif de ce projet est l'étude de l'intonosyntaxe du français parlé. Un corpus très richement annoté, le treebank Rhapsodie, sera présenté pendant les journées et mis en ligne à l'issu des journées (je vous enverrai un message quand ça sera en ligne). Il s'agit de 3h de parole (33 000 mots), formés d'une cinquantaine d'échantillons variés, avec pour la prosodie annotations des proéminences, structure prosodique arborescente, contours prosodiques simplifiés et pour la syntaxe, annotation morphosyntaxique, microsyntaxique en dépendance et annotation macrosyntaxique. L'ensemble du corpus est annoté, y compris les portions disfluentes.
Le corpus sera livré avec un système de requètes élaboré et une interface relativement conviviale. L'ensemble du corpus, ainsi qu'une grande partie des outils, seront distribués librement (licence Creative Commons).
Annotation syntaxique et prosodique du français parlé
Autour du treebank Rhapsodie
Mardi 19 juin (Paris 3 Censier, Salle Las Vergnas)
Session 1 : Les livrables Rhapsodie
10h30-10h40 Anne Lacheret : Mots de bienvenu
10H40-11h10 Anne Lacheret, Sylvain Kahane, Paola Pietrandrea : Présentation de la chaine de traitement : de l’annotation au corpus annoté en ligne
11h10-11h40 Arthur Truong : Première démo du corpus en ligne
11h40-12h : Pause café
12h-12h20 Atanas Tchobanov : Présentation du site Rhapsodie
12h20-12h40-Anne Lacheret, Sylvain Kahane, Paola Pietrandrea : Présentation de l’ouvrage sur le treebank Rhapsodie
12h40-13h Paola Pietrandrea, Anne Lacheret : Corpus design et métadonnées
13h-14h30 : Déjeuner
Session 3 : Outils pour l’annotation prosodique
14h30-14h50 Anne Dister, Jean-Philippe Goldman : Transcription et alignement
14h50- 15h10 Bernard Victorri : Analor : périodes et proéminences
15h10-15h30 Philippe Martin : Winpitch et nettoyage de la F0
15h30-15h50 : Pause café
Session 4 : Annotation syntaxique
15h50-16h10 Christophe Benzitoun, Frédéric Sabio: Structure macrosyntaxique
16h10-16h30 : Kim Gerdes, Sylvain Kahane : Structure microsyntaxique
16h30-16h50 : Kim Gerdes : Annotation semi-automatique avec Arborator
Mercredi 20 juin (Salles des conférences, Bât. B, Paris Ouest Nanterre)
Session 5 : Annotation syntaxique (outils)
10h00-10h20 : Julie Beliao : Du balisage manuel au treebank
10h20- 10h40 : Eric de la Clergerie : Analyse syntaxique automatique avec FRMG
10h40-11h00 : Pause café
Session 6 : Annotation prosodique
11h00-11h20 : Anne Lacheret : Le treebank prosodique de Rhapsodie
11h20-11h40 : Piet Mertens : Annotation prosodique : de la stylisation aux niveaux de hauteur et aux contours de syllabe
11h40-12h00 : Julie Beliao, Nicolas Obin : Contours globaux
12h00-12h20 : Cédric Gendrot : Durée des syllabes
12h20-14h00 : déjeuner
Session 7 : Treebank et interrogation
14h00-14h20 : Sylvain Kahane, Arthur Truong : Structure du treebank et de la base Rhapsodie
14h20-14h50 : Arthur Truong : Tutoriel sur le langage de requête
14h50-15h40 : Essai en groupe et discussion
15h40-16h00 : Pause café
Session 8 : Exploitation du Treebank
16h00-18h00 : Requêtage sur le Treebank par petits groupes
18h00-19h00 : Retour sur les travaux d’exploitation (10 mn par groupe)
10’ Loiseau, Gerdes, Benzitoun : stats syntaxe
10’ Gendrot, Lacheret, Goldman : stats proso
10’ Martin, Kahane : interface micro-prosodie
10’ Avanzi, Sabio : interface macro-prosodie
10’ Pietrandrea, Beliao : interface prosodie-entassement
Jeudi 21 juin (Salles des conférences, Bât. B, Paris Ouest Nanterre)
Session 9 : Bilan Rhaspodie
10h00 -10h30 José Deulofeu : Bilan annotation macrosyntaxique : En quoi découpe-t-on un texte ?
10h30- 11h00 Anne Lacheret : Annotation prosodique : bilan et perspectives
11h00-11h30 Pause
11h30-12h30 : Anne Lacheret, Sylvain Kahane, Kim Gerdes, Arthur Truong: Retour sur la chaine de traitement : les réussites et les erreurs à ne pas répéter
12h00-13h30 : Déjeuner
Session 10 : Le futur de Rhapsodie
14h00- 14h40 : Atanas Tchobanov, Arthur Truong : Maintenance et mise à jour du site Rhapsodie
14h40-15h00 Pause
15h00-17h00 : Table ronde : Elargissement du treebank Rhapsodie (ajouts d’échantillons, ajouts d’autres couches d’annotation, développement de la plateforme, etc.), dont discussion projet Orfeo (J.-M. Debaisieux)
-------------- next part --------------
An HTML attachment was scrubbed...
URL: <http://listserv.linguistlist.org/pipermail/parislinguists/attachments/20120606/d6805afa/attachment.htm>
More information about the Parislinguists
mailing list