These: Karen Fort, Vers une methodologie de l'annotation manuelle de corpus

Thierry Hamon thierry.hamon at UNIV-PARIS13.FR
Wed Nov 28 08:22:47 UTC 2012


Date: Sun, 25 Nov 2012 12:25:48 +0100 (CET)
From: Karen Fort <karen.fort at loria.fr>
Message-ID: <1473845698.7970074.1353842747963.JavaMail.root at loria.fr>


Bonjour, 

J'ai le plaisir de vous inviter à ma soutenance de thèse, intitulée : 

"Les ressources annotées, un enjeu pour l'analyse de contenu : 
vers une méthodologie de l'annotation manuelle de corpus" 

La soutenance se déroulera le vendredi 7 décembre, à 14h, à l'Université
Paris 13, Villetaneuse, salle B107 du LIPN (voir :
http://lipn.univ-paris13.fr/fr/contact). 
Elle sera suivie d'un pot auquel vous êtes bien sûr chaleureusement
conviés.


Composition du jury : 
- Frédéric Béchet, Professeur, Université de la Méditerranée (rapporteur) 
- Claire François, Ingénieure de Recherche, INIST-CNRS, Nancy 
- Benoît Habert, Professeur, ENS de Lyon (rapporteur) 
- Lori Lamel, Directrice de Recherche, LIMSI-CNRS, Orsay 
- François Lévy, Professeur émérite, Université Paris 13 
- Adeline Nazarenko, Professeure, Université Paris 13 (directrice) 
- Eric Villemonte de la Clergerie Chargé de Recherche, INRIA, Rocquencourt 


Résumé : 
L’annotation manuelle de corpus est devenue un enjeu fondamental pour le
Traitement Automatique des Langues (TAL). En effet, les corpus annotés
sont utilisés aussi bien pour créer que pour évaluer des outils de
TAL. Or, le processus d’annotation manuelle est encore mal connu et les
outils proposés pour supporter ce processus souvent mal utilisés, ce qui
ne permet pas de garantir le niveau de qualité de ces annotations. Nous
proposons dans cette thèse une vision unifiée de l’annotation manuelle
de corpus pour le TAL. Ce travail est le fruit de diverses expériences
de gestion et de participation à des campagnes d’annotation, mais
également de collaborations avec différents chercheur(e)s. Nous
proposons dans un premier temps une méthodologie globale pour la gestion
de campagnes d’annotation manuelle de corpus qui repose sur deux piliers
majeurs : une organisation des campagnes d’annotation qui met
l’évaluation au cœur du processus et une grille d’analyse des dimensions
de complexité d’une campagne d’annotation. Un second volet de notre
travail a concerné les outils du gestionnaire de campagne. Nous avons pu
évaluer l’influence exacte de la pré-annotation automatique sur la
qualité et la rapidité de correction humaine, grâce à une série
d’expériences menée sur l’annotation morpho-syntaxique de
l’anglais. Nous avons également apporté des solutions pratiques
concernant l’évaluation de l’annotation manuelle, en donnant au
gestionnaire les moyens de sélectionner les mesures les plus
appropriées. Enfin, nous avons mis au jour les processus en œuvre et les
outils nécessaires pour une campagne d’annotation et instancié ainsi la
méthodologie que nous avons décrite. 

Bien cordialement, 

Karën Fort 
Doctorante LIPN / ATER ENSMN 
Loria, équipe Sémagramme 
Bureau C303 
03 54 95 86 54 
http://lipn.univ-paris13.fr/~fort/ 

-------------------------------------------------------------------------
Message diffuse par la liste Langage Naturel <LN at cines.fr>
Informations, abonnement : http://www.atala.org/article.php3?id_article=48
English version       : 
Archives                 : http://listserv.linguistlist.org/archives/ln.html
                                http://liste.cines.fr/info/ln

La liste LN est parrainee par l'ATALA (Association pour le Traitement
Automatique des Langues)
Information et adhesion  : http://www.atala.org/
-------------------------------------------------------------------------



More information about the Ln mailing list