Seminaire: Acquisition automatique d'information sur la valence des verbes
Thierry Hamon
thierry.hamon at LIPN.UNIV-PARIS13.FR
Mon May 26 09:20:32 UTC 2008
Date: Fri, 23 May 2008 15:50:06 +0200
From: Elsa Tolone <elsa.tolone at univ-paris-est.fr>
Message-ID: <1211550606.4836cb8ee88c4 at www-igm.univ-mlv.fr>
X-url: http://infolingu.univ-mlv.fr
Prochain séminaire interne de linguistique :
Lundi 09/06/2008 à 10h30
Par: Cédric MESSIANT et Thierry POIBEAU
Titre :
Acquisition automatique d'information sur la valence des verbes à
partir de gros corpus
Résumé :
Même s'il existe des base de données lexicales sous format
électronique pour le français (le Lexique-grammaire, Dicovalence, le
Lefff, etc.), il existe peu de techniques permettant d'adapter ces
lexiques à de nouveaux domaines. Or, on sait que dans les domaines
techniques notamment (Droit, médecine, etc.), le comportement
langagier peut varier de manière importante et les ressources
existantes doivent être adaptées et complétées.
On présente ici une approche originale permettant d'inférer des
informations de valence à partir de gros corpus, sans lexique ni
schéma de valence prédéfini. La difficulté principale vient du fait
que l'on est confronté à des formes de surface ambiguës à partir
desquelles on souhaite inférer des connaissances non ambiguës. Les
expériences que nous présentons sont basées sur un corpus de 10 ans du
journal Le Monde, comprenant environ 200 millions de mots. On verra
l'apport des informations de nature statistiques dans ce cadre ; on
verra aussi comment les expériences effectuées peuvent nous amener à
voir de façon différente les notions d'arguments et de modifieurs.
Au cours de la discussion, on souhaite échanger sur ces techniques et
voir en quoi elles pourraient compléter des travaux de nature
différente, en particulier ceux qui visent à élaborer des bases
lexicales à la main.
Références :
- Cédric Messiant. 2008. ASSCI: A Subcategorization Frames Acquisition
System for French Verbs. In Association for Computational
Linguistics (ACL, Student Research Workshop), Columbus, Ohio.
- Cédric Messiant, Anna Korhonen, and Thierry Poibeau. 2008. LexSchem:
A Large Subcategorization Lexicon for French Verbs. In Language
Resource and Evaluation Conference (LREC), Marrakech.
- Thierry Poibeau and Cédric Messiant. 2008. Do we still need gold
standard for evaluation ? In Proceedings of the Language Resources
and Evaluation Conference (LREC), Marrakech.
Lieu :
Université Paris-Est, bâtiment Copernic 4ème étage, salle de
séminaire
URL : http://infolingu.univ-mlv.fr
Elsa Tolone
-------------------------------------------------------------------------
Message diffuse par la liste Langage Naturel <LN at cines.fr>
Informations, abonnement : http://www.atala.org/article.php3?id_article=48
English version :
Archives : http://listserv.linguistlist.org/archives/ln.html
http://liste.cines.fr/info/ln
La liste LN est parrainee par l'ATALA (Association pour le Traitement
Automatique des Langues)
Information et adhesion : http://www.atala.org/
-------------------------------------------------------------------------
More information about the Ln
mailing list