Seminaire: INFOLINGU, Universite Paris-Est, Olivier Ferret, le 07 mars 2011

Thierry Hamon thierry.hamon at UNIV-PARIS13.FR
Fri Mar 4 20:43:37 UTC 2011


Date: Thu,  3 Mar 2011 10:53:43 +0100
From: Anthony Sigogne <sigogne at univ-mlv.fr>
Message-ID: <1299146023.4d6f6527d623d at thompson.univ-mlv.fr>
X-url: http://liste.cines.fr//help/admin#moderate

************************************************************************
INFOLINGU
Le séminaire de l'équipe Informatique Linguistique
de l'Institut Gaspard Monge (LIGM)
************************************************************************

Date : *Le Lundi 07 mars 2011 à 10h30*

Lieu : Université Paris-Est Marne-la-Vallée
       Bâtiment Copernic, 4ème étage, salle 4B08R

************************************************************************

Orateur : Olivier Ferret (CEA LIST -- Laboratoire LVIC)

Utiliser une approche distributionnelle pour l'extraction automatique
de synonymes et de mots sémantiquement liés à partir de corpus

Résumé :

La définition de mesures sémantiques au niveau lexical a fait l'objet
de nombreux travaux depuis plusieurs années. Dans cette présentation,
nous nous focalisons plus spécifiquement sur les mesures de nature
distributionnelle, en nous appuyant dans un premier temps sur des
cooccurrences issues de fenêtres graphiques. Bien que différentes
évaluations aient été réalisées concernant ces mesures, il reste
difficile à établir si une mesure donnant de bons résultats dans un
cadre d'évaluation peut être appliquée plus largement avec le même
succès. Dans le travail présenté, nous commençons par sélectionner une
mesure de similarité sur la base d'un test de type TOEFL étendu. Nous
l'appliquons ensuite au problème de l'extraction automatique de
synonymes et de mots sémantiquement liés à partir de corpus en
comparant nos résultats à ceux de (Curran & Moens, 2002). Enfin, nous
testons deux pistes d'amélioration possibles : la transposition d'une
méthode d'amélioration de la qualité des données distributionnelles
proposée dans (Zhitomirsky-Geffet & Dagan, 2009) dans un cadre
d'implication textuelle et plus classiquement, l'utilisation de
cooccurrents syntaxiques.

-------------------------------------------------------------------------
Message diffuse par la liste Langage Naturel <LN at cines.fr>
Informations, abonnement : http://www.atala.org/article.php3?id_article=48
English version       : 
Archives                 : http://listserv.linguistlist.org/archives/ln.html
                                http://liste.cines.fr/info/ln

La liste LN est parrainee par l'ATALA (Association pour le Traitement
Automatique des Langues)
Information et adhesion  : http://www.atala.org/
-------------------------------------------------------------------------



More information about the Ln mailing list