Sujet de these: Analyse d ’opinions dans une collection de documents

Thierry Hamon thierry.hamon at UNIV-PARIS13.FR
Fri Sep 18 21:11:06 UTC 2009


Date: Fri, 18 Sep 2009 14:40:27 +0200
From: 
Message-ID: <4AB37FBB.4080303 at info.unicaen.fr>
X-url: http://www.info.unicaen.fr/~ferrari/


Proposition de thèse

Lieu: laboratoire GREYC – UMR 6072 – équipe « Données, Document et 
Langue », Université de Caen Basse-Normandie.

Durée : 3 ans, début prévu octobre 2009.

Disciplines concernées : TAL, Informatique, Linguistique, Ingénierie
des connaissances, IHM.

Cadre : projet ANR (appel Contenu et Interaction 2009) : « OntOpiTex –
Modèles linguistiques et ontologies. Extraction informatique et
caractérisation d’opinions et de jugements d’évaluation dans les
textes ».  Ces dernières années ont vu croître l'intérêt pour la
recherche informatisée des opinions, des attitudes ou des jugements
exprimés dans des textes. Cette tendance correspond à des enjeux
économiques et sociaux réels : veille économique, veille d'image (des
entreprises...), observatoire politique, développement de nouveaux
outils sur le Web. De nombreux travaux se limitent à la détermination
de polarités et ne parviennent pas à capter des significations plus
riches. Un des buts principaux du projet ANR OntOpiTex est d’avancer
dans le domaine en cherchant à identifier et à agréger des segments
textuels porteurs d'opinions caractérisées en fonction de plusieurs
critères (valeur sémantique, source, force, focus, type d'objet
évalué...) tels que ceux proposés par Martin et White (2005) dans le
système de l'Appraisal.  Un tel projet nécessite une approche
pluridisciplinaire associant linguistique et informatique, compétences
réunies chez les différents partenaires du projet.

Sujet :

Une thèse en informatique sur le thème « Analyse d’opinions dans une
collection de documents : annotations sémantiques, présentation
synthétique et interface de lecture ».
Il s'agit en résumé de reconnaître et de représenter le sens
d'expressions de jugements d'évaluation dans des collections de textes
d’un genre précis, et d’en proposer une présentation synthétique sous
forme d’interface interactive qui puisse servir d’accès et de guide de
lecture aux textes d’origine.
Le projet OntOpiTex permettra de fixer les corpus de travail ainsi que
des attentes précises en ce qui concerne l’interface présentant les
résultats d’analyse sur l’ensemble des documents d’une collection.  La
contribution principale de la thèse consistera à proposer une méthode
d’agrégation des connaissances issues de l’annotation sémantique des
opinions au sein des textes pour la mise en place d’une interface de
présentation de ces connaissances à l’échelle de la collection de
documents. Les visées applicatives seront en particulier d’offrir un
point de vue synthétique sur l’ensemble des opinions exprimées dans
une collection et de permettre la navigation interactive dans les
textes sources, en offrant notamment des guides ou parcours de lecture
selon des critères en rapport avec les propriétés des opinions
annotées.

Contact : les candidats intéressés sont invités à prendre contact
rapidement avec Stéphane Ferrari et Patrice Enjalbert
(Stephane.Ferrari at unicaen.fr , Patrice.Enjalbert at unicaen.fr) en
envoyant un CV détaillé, ainsi qu’une lettre de motivation.

GREYC - CNRS UMR 6072 - Université de Caen
UFR des LVE, Dpt LEA, F-14032 Caen cédex
+33 231567397
http://www.info.unicaen.fr/~ferrari/

-------------------------------------------------------------------------
Message diffuse par la liste Langage Naturel <LN at cines.fr>
Informations, abonnement : http://www.atala.org/article.php3?id_article=48
English version       : 
Archives                 : http://listserv.linguistlist.org/archives/ln.html
                                http://liste.cines.fr/info/ln

La liste LN est parrainee par l'ATALA (Association pour le Traitement
Automatique des Langues)
Information et adhesion  : http://www.atala.org/
-------------------------------------------------------------------------



More information about the Ln mailing list