Sujet de these: Modelisations et Annotation semantique d'opinions et de jugements d'evaluation dans les textes

Thierry Hamon thierry.hamon at UNIV-PARIS13.FR
Tue Jun 30 17:07:36 UTC 2009


Date: Mon, 29 Jun 2009 16:28:38 +0200
From: Agata Jackiewicz <Agata.Jackiewicz at paris-sorbonne.fr>
Message-ID: <4A48CF96.1010706 at paris-sorbonne.fr>


*** *Proposition de thèse dans le domaine de l’annotation sémantique
de textes* ***

Titre: « Modélisations et Annotation sémantique d’opinions et de
jugements d’évaluation dans les textes ».

Durée : 3 ans, début prévu septembre 2009.

Disciplines concernées : Linguistique, Informatique, TAL, Ingénierie
des connaissances.

Cadre : projet ANR (appel Contenu et Interaction 2009) : « OntOpiTex
Modèles linguistiques et ontologies. Extraction informatique et
caractérisation d’opinions et de jugements d’évaluation dans les
textes ».

Lieu: Equipe LaLIC, Université de Paris-Sorbonne, Maison de la
Recherche, 28 rue Serpente, Paris 6.

Candidat recherché : de formation principale en linguistique ou en
informatique (+ Master en TAL par exemple, mais pas exclusivement), le
candidat devra avoir des compétences dans les deux disciplines. De
plus, des connaissances en Ingénierie des connaissances (Ontologies,
Web sémantique) seraient un apport supplémentaire important pour la
thèse.

Contact : les candidats intéressés par ce sujet de thèse sont invités
à prendre contact rapidement avec Agata Jackiewicz et Philippe Laublet
(Agata.Jackiewicz at paris-sorbonne.fr ,
Philippe.Laublet at paris-sorbonne.fr ), en envoyant un CV détaillé,
ainsi qu’une lettre de motivation.

Sujet :

Ces dernières années ont vu croître l'intérêt pour la recherche
informatisée des opinions, des attitudes ou des jugements exprimés
dans des textes. Ceci correspond à des enjeux économiques et sociaux
réels : veille économique, veille d'image (des entreprises...),
observatoire politique ainsi qu’au développement de nouveaux outils
sur le Web. Les recherches académiques sur le sujet se multiplient et
parallèlement de nombreuses sociétés se positionnent sur ce marché
(études, produits...).  Pourtant la plupart des travaux actuels se
limitent souvent à la simple détermination de polarités positive,
négative, neutre et n'arrivent à capter que partiellement les
phénomènes visés qui recouvrent pourtant des significations riches,
diversifiées et souvent complexes. De plus, ces travaux s'intéressent
peu aux paramètres et au contexte de manière plus générale. Un des
buts principaux du projet ANR OntOpiTex est d’avancer dans le domaine
en cherchant à identifier et à agréger des segments textuels porteurs
d'opinions caractérisées finement, en fonction de plusieurs critères
(valeur sémantique, source, intensité et force, type d'objet évalué
...).

Un tel projet nécessite une approche pluridisciplinaire associant
linguistique et informatique, compétences réunies chez les différents
partenaires du projet.

La thèse proposée porte principalement sur la partie modélisation du
projet. Une partie importante du travail consistera en une étude des
constructions linguistiques qui expriment des opinions et des
jugements dans les textes. La théorie /Appraisal/ (Martin et White,
2005) a été retenue comme point de départ de l’étude. Portant sur
l’anglais, elle devra être évaluée, adaptée au français et enrichie à
partir d’un travail sur corpus que le candidat devra être capable de
mener de manière systématique et rigoureuse. Ce travail donnera lieu à
la constitution de ressources linguistiques pouvant être utilisées par
les outils de TAL déjà disponibles dans le projet.

Le doctorant proposera une formalisation du modèle linguistique obtenu
sous forme d’une ontologie afin de voir (i) comment cette
formalisation peut contribuer à enrichir la théorie initiale, (ii) ce
qu’elle peut apporter dans l’organisation des ressources linguistiques
et dans leur mise en œuvre à l’aide d’outils de TAL.

La mise en œuvre des modèles et ressources proposés, ainsi que leur
évaluation seront menées en collaboration avec les partenaires du
projet, en utilisant les formalismes de représentation proposés par la
plate-forme informatique existante, et les corpus de travail choisis
dans les applications prévues dans le projet.

-------------------------------------------------------------------------
Message diffuse par la liste Langage Naturel <LN at cines.fr>
Informations, abonnement : http://www.atala.org/article.php3?id_article=48
English version       : 
Archives                 : http://listserv.linguistlist.org/archives/ln.html
                                http://liste.cines.fr/info/ln

La liste LN est parrainee par l'ATALA (Association pour le Traitement
Automatique des Langues)
Information et adhesion  : http://www.atala.org/
-------------------------------------------------------------------------



More information about the Ln mailing list