Seminaire: Alpage, vendredi 11 juin (Bittar, Denis, Muller)

Thierry Hamon thierry.hamon at UNIV-PARIS13.FR
Thu Jun 10 19:38:10 UTC 2010


Date: Wed, 09 Jun 2010 14:49:45 +0200
From: muller at irit.fr
Message-ID: <4C0F8DE9.4090806 at irit.fr>


***************** Séminaire Alpage *******************

              Séminaire de l'école doctorale de Paris 7

Il s'agit du séminaire de recherche en linguistique informatique
organisé par l'équipe Alpage, Alpage est une équipe mixte Inria --
Paris 7 qui centre ses intérêts scientifiques autour de l'analyse
syntaxique automatique et du traitement du discours pour la langue
française.

Le séminaire se tiendra vendredi 11 juin à 11.00 en salle 131 à l'UFR
linguistique, 30 rue du Chateau des rentiers, 75013 Paris

Toute personne intéressée est la bienvenue.

***********************************************************

"Expérimentations en annotation d'informations temporelles"

André Bittar (1,2), Pascal Denis (1), Philippe Muller (1,3)

(1) Alpage, INRIA
(2) Université Paris Diderot
(3) IRIT, Université de Toulouse

Résumé:

Nous présenterons le problème de l'annotation d'informations
temporelles dans un texte, du point de vue automatisation et du point
de vue de la collecte de données de référence.  Nous comparons trois
formalismes de représentation utilisables pour l'apprentissage de
relations temporelles entre événements, sur les données du corpus
TimeBank. Les trois formalismes (relations de Allen, relations de
Bruce, relations de la campagne TempEval07) codent l'information
temporelle à différents niveaux de granularité et ne permettent pas
toutes les mêmes inférences. Elles se comportent également de façons
différentes quand il faut vérifier que les contraintes temporelles
extraites d'un texte sont cohérentes entre elles. Nos expériences
montrent que le jeu de relations TempEval07, bien que plus simple à
apprendre que les autres, est trop vague pour pouvoir être utilisé en
maintenant la cohérence des représentations.  Le jeu de relation de
Bruce semble montrer le meilleur compromis entre expressivité et
facilité d'utilisation.

Dans un deuxième temps, nous présenterons un projet actuel de collecte
de données temporelles sur le français basée sur le langage
d'annotation TimeML. L'objectif est la production d'un corpus annoté
de référence pouvant servir à la fois de corpus d'apprentissage pour
des applications TAL et comme outil d'étude linguistique sur les
phénomènes de temporalité en français. Nous présentons la méthodologie
adoptée ainsi que les résultats préliminaires du projet.

-------------------------------------------------------------------------
Message diffuse par la liste Langage Naturel <LN at cines.fr>
Informations, abonnement : http://www.atala.org/article.php3?id_article=48
English version       : 
Archives                 : http://listserv.linguistlist.org/archives/ln.html
                                http://liste.cines.fr/info/ln

La liste LN est parrainee par l'ATALA (Association pour le Traitement
Automatique des Langues)
Information et adhesion  : http://www.atala.org/
-------------------------------------------------------------------------



More information about the Ln mailing list