These: Maud Ehrmann - Entites Nommees : statut theorique et methodes de desambiguisation

Thierry Hamon thierry.hamon at LIPN.UNIV-PARIS13.FR
Thu May 29 15:33:31 UTC 2008


Date: Thu, 29 May 2008 10:29:49 +0200
From: Maud Ehrmann <Maud.Ehrmann at xrce.xerox.com>
Message-ID: <483E697D.8030304 at xrce.xerox.com>


Bonjour,

J'ai le plaisir de vous inviter à la soutenance de ma thèse intitulée :

"Les Entités Nommées, de la linguistique au TAL : statut théorique et
méthodes de désambiguïsation."

qui aura lieu le Lundi 2 Juin à 14h au 30 rue du Château des Rentiers 
(Paris 13eme), salle 131, devant un jury composé de

Mme Laurence Danlos (Présidente),
Mme Adeline Nazarenko (Rapporteur),
M. Pierre Zweigenbaum (Rapporteur),
M. Bernard Victorri (Directeur),
Mme Caroline Brun (Examinatrice - Tuteur industriel),
M. Marcel Cori (Examinateur).

Cette thèse a été réalisée dans le cadre d'une convention CIFRE, en
partenariat avec le laboratoire du LaTICCe (Paris 7) et le Centre de
Recherche Xerox à Grenoble, au sein de l'équipe /ParSem/, dirigée par
Mme Frédérique Segond.

Vous êtes également convié au pot qui suivra.

Cordialement,

Maud Ehrmann.

******
Résumé de la thèse:

Le traitement des entités nommées fait aujourd'hui figure
d'incontournable en Traitement Automatique des Langues. Apparue au
milieu des années 1990 à la faveur des dernières conférences MUC
(Message Understanding Conferences), la tâche de reconnaissance et de
catégorisation des noms de personnes, de lieux, d'organisations, etc.
apparaît en effet comme fondamentale pour diverses applications
participant de l'analyse de contenu et nombreux sont les travaux se
consacrant à sa mise en oeuvre, obtenant des résultats plus
qu'honorables. Fort de ce succès, le traitement des entités nommées
s'oriente désormais vers de nouvelles perspectives avec, entre autres,
la désambiguïsation et une annotation enrichie de ces unités. Ces
nouveaux défis rendent cependant d'autant plus cruciale la question du
statut théorique des entités nommées, lequel n'a guère été discuté
jusqu'à aujourd'hui.

Deux axes de recherche ont par conséquent été investis durant ce travail 
de thèse: nous avons, d'une part, tenté de proposer une définition des 
entités nommées et, d'autre part, expérimenté des méthodes de 
désambiguïsation. A la suite d'un état des lieux de la tâche de 
reconnaissance de ces unités et d'un exposé des difficultés pouvant se 
présenter à l'occasion d'une telle entreprise, il fut avant tout 
nécessaire d'examiner, d'un point de vue méthodologique, comment aborder 
la question de la définition les entités nommées. La démarche adoptée 
invita à se tourner du côté de la linguistique, avec les noms propres et 
les descriptions définies, puis du côté du traitement automatique, ce 
parcours visant au final à proposer une définition tenant compte tant 
des aspects du langage que des capacités et exigences des systèmes 
informatiques. La suite du mémoire rend compte d'un travail davantage 
expérimental, avec l'exposé d'une méthode d'annotation fine tout 
d'abord, de résolution de métonymie enfin. Ces travaux, combinant 
approche symbolique et approche distributionnelle, rendent compte de la 
possibilité d'une double annotation (catégories générales et catégories 
fines) et d'une désambiguïsation des entités nommées.




-------------------------------------------------------------------------
Message diffuse par la liste Langage Naturel <LN at cines.fr>
Informations, abonnement : http://www.atala.org/article.php3?id_article=48
English version       : 
Archives                 : http://listserv.linguistlist.org/archives/ln.html
                                http://liste.cines.fr/info/ln

La liste LN est parrainee par l'ATALA (Association pour le Traitement
Automatique des Langues)
Information et adhesion  : http://www.atala.org/
-------------------------------------------------------------------------



More information about the Ln mailing list