These: Didier Schwab, Approche hybride pour la modélisation, la detection et l'exploitation des fonctions lexicales

Thierry Hamon thierry.hamon at LIPN.UNIV-PARIS13.FR
Fri Nov 25 13:10:15 UTC 2005


Date: Thu, 24 Nov 2005 08:27:53 +0100
From: Didier Schwab <schwab at lirmm.fr>
Message-ID: <43856B79.3000501 at lirmm.fr>
X-url: http://www.lirmm.fr/~schwab/these_Schwab.pdf
X-url: http://www.lirmm.fr/~schwab


Bonjour à tous,

Je soutiendrai ma thèse intitulée :

Approche hybride - lexicale et thématique - pour la modélisation, la 
détection et l'exploitation des fonctions lexicales en vue de l'analyse 
sémantique de texte.

le Mercredi 7 Décembre 2005 à 11H dans la salle des séminaires du lirmm, 
161, rue Ada - 34392 Montpellier Cedex 5.

Vous y êtes conviés ainsi qu'au pot qui suivra.

_______________________________________________________________________

Jury :
GÉRARD SABAH, directeur de recherche au CNRS, LIMSI-CNRS, Orsay
              (rapporteur)
CHRISTIAN BOITET, Professeur à l'Université Joseph Fourier 
                 (Grenoble 1)
CLIPS-IMAG équipe GETA (rapporteur)
CHRISTOPHE LECERF, Professeur à l'EMA (examinateur)
ROLAND DUCOURNEAU, Professeur d'Informatique, UMII (examinateur)
VIOLAINE PRINCE, Professeur d'Informatique, UMII (directrice)
MATHIEU LAFOURCADE, MCF Informatique, UMII (co-directeur)

Résumé :

Utilisée à la fois pour l'apprentissage et l'exploitation des vecteurs
conceptuels, l'analyse sémantique de texte est centrale à nos
recherches. L'amélioration qualitative du processus d'analyse entraîne
celle des vecteurs. En retour, cette meilleure pertinence à un effet
positif sur l'analyse. Parmi les différentes voies à explorer pour
obtenir ce cercle vertueux, l'une des pistes les plus intéressante
semble être la découverte puis l'exploitation des relations lexicales
entre les mots du texte. Ces relations, parmi lesquelles la synonymie,
l'antonymie, l'hyperonymie, la bonification ou l'intensification, sont
modélisables sous la forme de fonctions lexicales. Énoncées
essentiellement dans un cadre de production par Igor Mel'cuk, nous
cherchons, dans cette thèse, à les adapter à un cadre d'analyse. Nous
introduisons ici deux classes de Fonctions Lexicales d'Analyse. Les
premières, les FLA de construction permettent de fabriquer un vecteur
conceptuel à partir des informations lexicales disponibles. Les
secondes, les FLA d'évaluation permettent de mesurer la pertinence
d'une relation lexicale entre plusieurs termes. Ces dernières sont
modélisables grâce à des informations thématiques (vecteurs
conceptuels) et/ou grâce à des informations lexicales (relations
symboliques entre les objets lexicaux).

Les informations lexicales sont issues de la base lexicale sémantique
dont nous introduisons l'architecture à trois niveaux d'objets
lexicaux (item lexical, acception, lexie). Elles sont matérialisées
sous la forme de Relations Lexicales Valuées qui traduisent la
probabilité d'existence de la relation entre les objets.  L'utilité de
ces relations a pu être mis en évidence pour l'analyse sémantique
grâce à l'utilisation du paradigme des algorithmes à fourmis. Le
modèle introduit dans cette thèse, utilise à la fois les vecteurs
conceptuels et les relations du réseau lexical pour résoudre une
partie des problèmes posés lors d'une analyse sémantique.

Tous nos outils ont été implémentés en Java. Ils reposent sur Blexisma
(Base LEXIcale Sémantique Multi-Agents) une architecture multi-agents
élaborée au cours de cette thèse dont l'objectif est d'intégrer tout
élément lui permettant de créer, d'améliorer et d'exploiter une ou
plusieurs Bases Lexicales Sémantiques. Les expériences menées ont
montré la faisabilité de cette approche, sa pertinence en terme
d'amélioration globale de l'analyse et ouvert des perspectives de
recherches fort intéressantes.

____________________________________________________________________________

La version pdf courante de cette thèse se trouve à
l'adresse :

http://www.lirmm.fr/~schwab/these_Schwab.pdf

Didier

-- 
Didier SCHWAB                       Tel.  33 - 04 67 41 85 71
doctorant (PhD student)
                                     Fax.  33 - 04 67 41 85 00
LIRMM
161, rue Ada                        Email : schwab at lirmm.fr
34392 Montpellier Cedex 5
                                     http://www.lirmm.fr/~schwab


-------------------------------------------------------------------------
Message diffusé par la liste Langage Naturel <LN at cines.fr>
Informations, abonnement : http://www.biomath.jussieu.fr/LN/LN-F/
English version          : http://www.biomath.jussieu.fr/LN/LN/
Archives                 : http://listserv.linguistlist.org/archives/ln.html

La liste LN est parrainée par l'ATALA (Association pour le Traitement
Automatique des Langues)
Information et adhésion  : http://www.atala.org/
-------------------------------------------------------------------------



More information about the Ln mailing list