Job: Stage, annotation semantique de textes, LIPN, Villetaneuse
Thierry Hamon
thierry.hamon at UNIV-PARIS13.FR
Wed Mar 30 19:45:01 UTC 2011
Date: Mon, 28 Mar 2011 15:05:09 +0200
From: Francois Lévy <Francois.Levy at lipn.univ-paris13.fr>
Message-Id: <302FF600-6915-4CAB-BA9F-796264C91253 at lipn.univ-paris13.fr>
X-url: http://www-lipn.univ-paris13.fr/RCLN/divers/stages_master_2011.html
http://www-lipn.univ-paris13.fr/RCLN/divers/stages_master_2011.html
Articuler annotation sémantique de textes et mise à jour du modèle
d'annotation
L'annotation de texte consiste à apposer sur le texte des informations
ou métadonnées dont la sémantique est portée par un modèle
d'annotation (formalisme et jeu d'étiquettes). Le processus
d'annotation, qu'il soit manuel, automatique ou semi-automatique
suppose qu'un tel modèle ait été défini au préalable pour spécifier le
type et la valeur des annotations que peuvent porter différents
éléments textuels.
L'annotation sémantique obéit à la même logique avec cette spécificité
que les annotations ont pour ob jectif d'expliciter le sens porté par
le document qui est annoté. L'influence des travaux issus du web
sémantique et la maîtrise du clacul ontologique font que les modèles
d'annotation sémantique sont souvent de nature ontologique.
Cependant, le processus habituel consiste à construire un modèle puis
à annoter au regard de celui-ci et ne prévoit pas d'évolution du
modèle d'annotation, ce qui pose problème dans les cas nombreux où le
modèle doit évoluer (correction, précision, enrichissement, mise à
jour) au cours de la phase d'annotation.
Parallèlement, des outils existent pour annoter sémantiquement des
textes, de manière automatique ou manuelle, au regard d'une ontologie:
amaya, Firefox, SMORE, Gate's editor, Melita. Ces outils ne prennent
pas non plus en compte la mise à jour dynamique du modèle en cours
d'annotation et la possible réannotation du texte au regard du modèle
qui est mis à jour.
L'objet de ce stage est de formaliser ce processus de mise à jour du
modèle d'annotation au cours de l'annotation et de proposer une
méthode et des outils permettant de la gérer.
Ce travail s'intégrera dans le projet ONTORULE dont l'un des enjeux
est l'annotation sémantique de textes réglementaires et s'appuiera sur
les pratiques existantes d'annotation, à la fois manuelle et
automatique. On fera l'hypothèse que le modèle d'annotation est de
nature ontologique, même si d'autres types de modèles peuvent être
envisagés. Il s'agira
1. de recenser les types de modifications nécessaires sur la base de
l'analyse des cas d'usage du projet ONTORULE (ajout, suppression,
modification de certaines unités ontologique, restructuration de
l'ontologie, modification des connaissances lexicales associées) ;
2. de définir une stratégie de mise-à-jour pour ces différents types de
modifications ;
3. d'implémenter certaines de ces stratégies sur un outil d'annotation
existant ;
4. de tester et d'évaluer les stratégies proposées au regard de
l'analyse des besoins effectuées au point 1.
Ce stage sera rémunéré. Il aura lieu au LIPN, université Paris 13, à
Villetaneuse (93). Envoyer votre candidature avec CV à
Francois.Levy at lipn.univ-paris13.fr
-------------------------------------------------------------------------
Message diffuse par la liste Langage Naturel <LN at cines.fr>
Informations, abonnement : http://www.atala.org/article.php3?id_article=48
English version :
Archives : http://listserv.linguistlist.org/archives/ln.html
http://liste.cines.fr/info/ln
La liste LN est parrainee par l'ATALA (Association pour le Traitement
Automatique des Langues)
Information et adhesion : http://www.atala.org/
-------------------------------------------------------------------------
More information about the Ln
mailing list