These: Damien Nouvel, Reconnaissance des entites nommees par exploration de regles d'annotation

Thierry Hamon thierry.hamon at UNIV-PARIS13.FR
Fri Nov 9 21:00:36 UTC 2012


Date: Tue, 6 Nov 2012 10:00:46 +0100
From: Damien Nouvel <damien.nouvel at inria.fr>
Message-ID: <CAHKNiVVmKveaUft8qM+NTzDed1E1nS5OZY9yoGeWWAcH7257qw at mail.gmail.com>

Bonjour,

J'ai le plaisir de vous inviter à ma soutenance de thèse intitulée
"Reconnaissance des entités nommées par exploration de règles
d'annotation", qui aura lieu le mardi 20 novembre, à 14h15, à l'antenne
universitaire de Blois (amphi 1). La soutenance sera suivie d'un pot
auquel vous êtes chaleureusement conviés.

Cordialement,

Damien Nouvel

--

Thèse :

Reconnaissance des entités nommées par exploration de règles
d'annotation
  - Interpréter les marqueurs d’annotation comme instructions de
    structuration locale

Date et lieu :
* mardi 20 novembre à 14h15
* antenne universitaire de Blois (3 place Jean-Jaurès, Blois), amphi 1
  (sous-sol)

Résumé :

Ces dernières décennies, le développement considérable des technologies
de l'information et de la communication a modifié en profondeur la
manière dont nous avons accès aux connaissances. Face à l'afflux de
données et à leur diversité, il est nécessaire de mettre au point des
technologies performantes et robustes pour y rechercher des
informations. A cet effet, les entités nommées (personnes, lieux,
organisations, dates, expressions numériques, marques, fonctions, etc.)
sont sollicitées dans l'objectif de catégoriser, d'indexer, ou, plus
généralement, de manipuler des contenus.  L'identification de ces
éléments est souvent réalisée à l'aide de procédures dites
d'annotation. Notre travail porte sur la reconnaissance et l'annotation
des entités nommées au sein de transcriptions d'émissions radiodiffusées
ou télévisuelles. A cet effet, nous explorons des données dans
lesquelles sont relevées les entités nommées, pour extraire des règles
d'annotation (qui s'appuient sur des instructions locales) afin
d'élaborer un système de reconnaissance automatique des entités nommées.
En première partie, nous abordons la problématique du traitement
automatique du langage et des entités nommées en particulier. Nous
revenons sur la relation qu'entretien l'automate avec le langage et
décrivons les analyses généralement conduites pour traiter le langage
naturel. Nous abordons ensuite la problématique des entités nommées
(rétrospective des notions recouvertes, typologies, évaluation et
annotation) et proposons une caractérisation de leur nature
linguistique. Nous concluons cette partie par un positionnement à
l'égard des approches état de l'art du domaine et par notre proposition,
centrée sur les marqueurs (balises) de début ou de fin d'annotation. En
seconde partie, nous exposons le formalisme d'exploration de données que
nous adoptons. Nous commençons par le situer au sein des méthodes de
fouille de texte. Puis nous nous dotons d'un cadre formel pour explorer
les motifs, en particulier ceux qui sont corrélés aux marqueurs
d'annotation, que nous nommons règles d'annotation. Enfin, nous
présentons les modèles que nous utilisons lorsqu'il s'agit d'exploiter
ces règles extraites afin de réaliser l'annotation d'un texte donné. La
dernière partie décrit le système implémenté, mXS, et les résultats
obtenus. Nous détaillons en premier lieu les modules de traitements,
ressources lexicales et corpus à notre disposition pour mener les
expériences. Nous présentons ensuite la mise en oeuvre et les résultats
pour l'exploration des données et pour l'extraction des règles
d'annotation. Enfin, nous fournissons des résultats chiffrés relatifs
aux performances obtenues par mXS, ainsi que des indicateurs
supplémentaires quant au comportement du système à divers point de vue
et dans diverses configurations. Ils montrent que l'approche que nous
proposons est compétitive et qu'elle ouvre des perspectives dans le
cadre du traitement du langage et de l'annotation automatique.

Composition du jury :
* M. Jean-Yves Antoine, Professeur des universités, Université François
  Rabelais de Tours (directeur)
* M. Frédéric Béchet, Professeur des universités, Aix Marseille
  Université (examinateur)

* M. Bruno Crémilleux, Professeur des universités, Université de Caen
  (rapporteur)

* Mme Nathalie Friburger, Maître de conférences, Université François
  Rabelais de Tours (encadrante)

* Mme Sophie Rosset, Directrice de recherche, LIMSI-CNRS (rapporteure)

* M. Arnaud Soulet, Maître de conférences, Université François Rabelais de
  Tours (encadrant)

-------------------------------------------------------------------------
Message diffuse par la liste Langage Naturel <LN at cines.fr>
Informations, abonnement : http://www.atala.org/article.php3?id_article=48
English version       : 
Archives                 : http://listserv.linguistlist.org/archives/ln.html
                                http://liste.cines.fr/info/ln

La liste LN est parrainee par l'ATALA (Association pour le Traitement
Automatique des Langues)
Information et adhesion  : http://www.atala.org/
-------------------------------------------------------------------------



More information about the Ln mailing list