These: Maud Ehrmann - Entites Nommees : statut theorique et methodes de desambiguisation
Thierry Hamon
thierry.hamon at LIPN.UNIV-PARIS13.FR
Thu May 29 15:33:31 UTC 2008
Date: Thu, 29 May 2008 10:29:49 +0200
From: Maud Ehrmann <Maud.Ehrmann at xrce.xerox.com>
Message-ID: <483E697D.8030304 at xrce.xerox.com>
Bonjour,
J'ai le plaisir de vous inviter à la soutenance de ma thèse intitulée :
"Les Entités Nommées, de la linguistique au TAL : statut théorique et
méthodes de désambiguïsation."
qui aura lieu le Lundi 2 Juin à 14h au 30 rue du Château des Rentiers
(Paris 13eme), salle 131, devant un jury composé de
Mme Laurence Danlos (Présidente),
Mme Adeline Nazarenko (Rapporteur),
M. Pierre Zweigenbaum (Rapporteur),
M. Bernard Victorri (Directeur),
Mme Caroline Brun (Examinatrice - Tuteur industriel),
M. Marcel Cori (Examinateur).
Cette thèse a été réalisée dans le cadre d'une convention CIFRE, en
partenariat avec le laboratoire du LaTICCe (Paris 7) et le Centre de
Recherche Xerox à Grenoble, au sein de l'équipe /ParSem/, dirigée par
Mme Frédérique Segond.
Vous êtes également convié au pot qui suivra.
Cordialement,
Maud Ehrmann.
******
Résumé de la thèse:
Le traitement des entités nommées fait aujourd'hui figure
d'incontournable en Traitement Automatique des Langues. Apparue au
milieu des années 1990 à la faveur des dernières conférences MUC
(Message Understanding Conferences), la tâche de reconnaissance et de
catégorisation des noms de personnes, de lieux, d'organisations, etc.
apparaît en effet comme fondamentale pour diverses applications
participant de l'analyse de contenu et nombreux sont les travaux se
consacrant à sa mise en oeuvre, obtenant des résultats plus
qu'honorables. Fort de ce succès, le traitement des entités nommées
s'oriente désormais vers de nouvelles perspectives avec, entre autres,
la désambiguïsation et une annotation enrichie de ces unités. Ces
nouveaux défis rendent cependant d'autant plus cruciale la question du
statut théorique des entités nommées, lequel n'a guère été discuté
jusqu'à aujourd'hui.
Deux axes de recherche ont par conséquent été investis durant ce travail
de thèse: nous avons, d'une part, tenté de proposer une définition des
entités nommées et, d'autre part, expérimenté des méthodes de
désambiguïsation. A la suite d'un état des lieux de la tâche de
reconnaissance de ces unités et d'un exposé des difficultés pouvant se
présenter à l'occasion d'une telle entreprise, il fut avant tout
nécessaire d'examiner, d'un point de vue méthodologique, comment aborder
la question de la définition les entités nommées. La démarche adoptée
invita à se tourner du côté de la linguistique, avec les noms propres et
les descriptions définies, puis du côté du traitement automatique, ce
parcours visant au final à proposer une définition tenant compte tant
des aspects du langage que des capacités et exigences des systèmes
informatiques. La suite du mémoire rend compte d'un travail davantage
expérimental, avec l'exposé d'une méthode d'annotation fine tout
d'abord, de résolution de métonymie enfin. Ces travaux, combinant
approche symbolique et approche distributionnelle, rendent compte de la
possibilité d'une double annotation (catégories générales et catégories
fines) et d'une désambiguïsation des entités nommées.
-------------------------------------------------------------------------
Message diffuse par la liste Langage Naturel <LN at cines.fr>
Informations, abonnement : http://www.atala.org/article.php3?id_article=48
English version :
Archives : http://listserv.linguistlist.org/archives/ln.html
http://liste.cines.fr/info/ln
La liste LN est parrainee par l'ATALA (Association pour le Traitement
Automatique des Langues)
Information et adhesion : http://www.atala.org/
-------------------------------------------------------------------------
More information about the Ln
mailing list