Conf: Colloque sur l'annotation du fran=?ISO-8859-1?Q?=E7ais_?=parle, Paris, 19-21 juin 2012
Thierry Hamon
thierry.hamon at UNIV-PARIS13.FR
Sat Jun 9 20:12:33 UTC 2012
Date: Wed, 6 Jun 2012 18:14:16 +0200
From: Sylvain Kahane <sylvain at kahane.fr>
Message-Id: <8579F6B2-F39D-44FD-8A8A-734FE40D6BDA at kahane.fr>
Ce colloque de trois jours est organisé par Anne Lacheret, Sylvain
Kahane et Paola Pietrandrea pour la cloture du projet ANR Rhapsodie
commencé en 2008.
L'objectif de ce projet est l'étude de l'intonosyntaxe du français
parlé. Un corpus très richement annoté, le treebank Rhapsodie, sera
présenté pendant les journées et mis en ligne à l'issu des journées (je
vous enverrai un message quand ça sera en ligne). Il s'agit de 3h de
parole (33 000 mots), formés d'une cinquantaine d'échantillons variés,
avec pour la prosodie annotations des proéminences, structure prosodique
arborescente, contours prosodiques simplifiés et pour la syntaxe,
annotation morphosyntaxique, microsyntaxique en dépendance et annotation
macrosyntaxique. L'ensemble du corpus est annoté, y compris les portions
disfluentes.
Le corpus sera livré avec un système de requètes élaboré et une
interface relativement conviviale. L'ensemble du corpus, ainsi qu'une
grande partie des outils, seront distribués librement (licence Creative
Commons).
Annotation syntaxique et prosodique du français parlé
Autour du treebank Rhapsodie
Mardi 19 juin (Paris 3 Censier, Salle Las Vergnas)
Session 1 : Les livrables Rhapsodie
10h30-10h40 Anne Lacheret : Mots de bienvenu
10H40-11h10 Anne Lacheret, Sylvain Kahane, Paola Pietrandrea :
Présentation de la chaine de traitement : de l’annotation au corpus
annoté en ligne
11h10-11h40 Arthur Truong : Première démo du corpus en ligne
11h40-12h : Pause café
12h-12h20 Atanas Tchobanov : Présentation du site Rhapsodie
12h20-12h40-Anne Lacheret, Sylvain Kahane, Paola Pietrandrea :
Présentation de l’ouvrage sur le treebank Rhapsodie
12h40-13h Paola Pietrandrea, Anne Lacheret : Corpus design et
métadonnées
13h-14h30 : Déjeuner
Session 3 : Outils pour l’annotation prosodique
14h30-14h50 Anne Dister, Jean-Philippe Goldman : Transcription et
alignement
14h50- 15h10 Bernard Victorri : Analor : périodes et proéminences
15h10-15h30 Philippe Martin : Winpitch et nettoyage de la F0
15h30-15h50 : Pause café
Session 4 : Annotation syntaxique
15h50-16h10 : Christophe Benzitoun, Frédéric Sabio: Structure
macrosyntaxique
16h10-16h30 : Kim Gerdes, Sylvain Kahane : Structure microsyntaxique
16h30-16h50 : Kim Gerdes : Annotation semi-automatique avec Arborator
Mercredi 20 juin (Salles des conférences, Bât. B, Paris Ouest Nanterre)
Session 5 : Annotation syntaxique (outils)
10h00-10h20 : Julie Beliao : Du balisage manuel au treebank
10h20- 10h40 : Eric de la Clergerie : Analyse syntaxique automatique
avec FRMG
10h40-11h00 : Pause café
Session 6 : Annotation prosodique
11h00-11h20 : Anne Lacheret : Le treebank prosodique de Rhapsodie
11h20-11h40 : Piet Mertens : Annotation prosodique : de la stylisation
aux niveaux de hauteur et aux contours de syllabe
11h40-12h00 : Julie Beliao, Nicolas Obin : Contours globaux
12h00-12h20 : Cédric Gendrot : Durée des syllabes
12h20-14h00 : déjeuner
Session 7 : Treebank et interrogation
14h00-14h20 : Sylvain Kahane, Arthur Truong : Structure du treebank et
de la base Rhapsodie
14h20-14h50 : Arthur Truong : Tutoriel sur le langage de requête
14h50-15h40 : Essai en groupe et discussion
15h40-16h00 : Pause café
Session 8 : Exploitation du Treebank
16h00-18h00 : Requêtage sur le Treebank par petits groupes
18h00-19h00 : Retour sur les travaux d’exploitation (10 mn par groupe)
10’ Loiseau, Gerdes, Benzitoun : stats syntaxe
10’ Gendrot, Lacheret, Goldman : stats proso
10’ Martin, Kahane : interface micro-prosodie
10’ Avanzi, Sabio : interface macro-prosodie
10’ Pietrandrea, Beliao : interface prosodie-entassement
Jeudi 21 juin (Salles des conférences, Bât. B, Paris Ouest Nanterre)
Session 9 : Bilan Rhaspodie
10h00 -10h30 José Deulofeu : Bilan annotation macrosyntaxique : En quoi
découpe-t-on un texte ?
10h30- 11h00 Anne Lacheret : Annotation prosodique : bilan et
perspectives
11h00-11h30 Pause
11h30-12h30 : Anne Lacheret, Sylvain Kahane, Kim Gerdes, Arthur Truong:
Retour sur la chaine de traitement : les réussites et les erreurs à ne
pas répéter
12h00-13h30 : Déjeuner
Session 10 : Le futur de Rhapsodie
14h00- 14h40 : Atanas Tchobanov, Arthur Truong : Maintenance et mise à
jour du site Rhapsodie
14h40-15h00 Pause
15h00-17h00 : Table ronde : Elargissement du treebank Rhapsodie (ajouts
d’échantillons, ajouts d’autres couches d’annotation, développement de
la plateforme, etc.), dont discussion projet Orfeo (J.-M. Debaisieux)
-------------------------------------------------------------------------
Message diffuse par la liste Langage Naturel <LN at cines.fr>
Informations, abonnement : http://www.atala.org/article.php3?id_article=48
English version :
Archives : http://listserv.linguistlist.org/archives/ln.html
http://liste.cines.fr/info/ln
La liste LN est parrainee par l'ATALA (Association pour le Traitement
Automatique des Langues)
Information et adhesion : http://www.atala.org/
-------------------------------------------------------------------------
More information about the Ln
mailing list