These: Baptiste Chardon, Chaine de traitement pour une approche discursive de l'analyse d'opinion
Thierry Hamon
thierry.hamon at UNIV-PARIS13.FR
Wed Jun 5 07:03:57 UTC 2013
Date: Tue, 4 Jun 2013 10:33:00 +0200
From: "Baptiste Chardon" <baptiste.chardon at synapse-fr.com>
Message-ID: <002c01ce60fe$1fd89390$5f89bab0$@synapse-fr.com>
Bonjour,
J'ai le plaisir de vous inviter à la soutenance de ma thèse intitulée :
"Chaîne de traitement pour une approche discursive de l'analyse
d'opinion"
Cette soutenance se déroulera le mercredi 12 juin 2013 à 9h00, à l'IRIT,
Université Paul Sabatier,
118 Route de Narbonne, 31400 TOULOUSE - salle des thèses.
Vous êtes également cordialement conviés au pot qui suivra.
Bien cordialement,
Baptiste Chardon
---------------------------------------
Le jury de soutenance sera composé de :
Rapporteurs :
Maite Taboada - Associate Professor (Simon Fraser University, Canada)
Alexis Nasr - Professeur (LIF, Université Aix-Marseille)
Examinateurs:
Farah Benamara (Directrice de thèse) - Maître de conférences (IRIT,
Université Paul Sabatier Toulouse 3)
Nicholas Asher (Directeur de thèse) - Directeur de recherches (IRIT,
Université Paul Sabatier Toulouse 3 - CNRS)
Yvette Yannick Mathieu - Directeur de recherches (Université Paris 7 - CNRS)
Florence Sèdes - Professeur (IRIT, Université Paul Sabatier Toulouse 3)
Membre invité:
Patrick Séguéla - Gérant (Synapse Développement, Toulouse)
------------------------------------------
Résumé
La structure discursive d'un texte est un élément essentiel à la
compréhension du contenu véhiculé par ce texte. Elle affecte, par
exemple, la structure temporelle du texte, ou encore l'interprétation
des expressions anaphoriques. La structure discursive a montré son
utilité dans de nombreuses applications de TAL, telles que le résumé
automatique, ou encore l’inférence textuelle. Dans cette thèse, nous
aborderons les effets de la structure discursive sur l'analyse de
sentiments.
L’analyse des sentiments est un domaine de recherche extrêmement actif
en traitement automatique des langues. En effet, ces dernières années
ont vu se multiplier les sources de données textuelles porteuses
d'opinion disponibles sur le web : avis d'internautes, de plus en plus
centralisés par les moteurs de recherche, forums, réseaux sociaux,
enquêtes consommateurs effectuées par les grandes marques. Devant cette
abondance de données et de sources, l'automatisation de la synthèse des
multiples avis devient cruciale pour obtenir efficacement une vue
d'ensemble des opinions sur un sujet donné. L'intérêt de ces données
est considérable, pour les sociétés qui souhaitent obtenir un retour
client sur leurs produits ou leur image de marque comme pour les
personnes souhaitant se renseigner pour un achat, une sortie, ou un
voyage.
La plupart des travaux actuels proposent une analyse des opinions au
niveau du document ou au niveau de la phrase en ignorant la structure
discursive. Dans cette thèse, nous nous plaçons dans le contexte de la
théorie de la SDRT (Segmented Discourse Representation Theory) et
proposons de répondre aux questions suivantes :
- Existe-t-il un lien entre la structure discursive d’un document et les
opinions émises dans ce même document ?
- Quel est le rôle des relations de discours dans la détermination du
caractère objectif ou subjectif d’un segment textuel ?
- Quel est le rôle des éléments linguistiques, comme la négation et la
modalité, lors de la détermination de la polarité d’un segment textuel
subjectif ?
- Quel est l’impact de la structure discursive lors de la détermination
de l’opinion globale véhiculée dans un document ?
- Est-ce qu'une approche basée sur le discours apporte une réelle valeur
ajoutée comparée à une approche classique basée sur la notion de ‘sacs
de mots’ ?
- Cette valeur ajoutée est-elle dépendante du genre de corpus ?
Afin de répondre à ces questions, nous proposons dans un premier temps
un schéma d'annotation sur deux niveaux : tout d'abord au niveau du
segment de discours, où chaque segment doit être annoté selon l'opinion
qu'il véhicule, et ensuite au niveau du document, où tout segment doit
être relié discursivement au reste du texte. Dans le but d'étudier
l'impact des contraintes de genre du texte, notre campagne d'annotation
a été conduite sur deux corpus de genres différents en français :
commentaires de film d'une part, et commentaires d'articles de presse
d'autre part. Nous proposons ensuite une architecture informatique
permettant d’analyser les opinions dans le discours selon différents
niveaux de grain :
- Au niveau du segment où nous proposons de sélectionner les segments
discursifs porteurs d'opinion du document à l'aide de deux
classifieurs parallèles. La présence de traits discursifs permet de
reconnaître une part importante des segments implicites, c'est-à-dire
des segments ne comportant pas d'opinion lexicalisée.
- Au niveau des expressions d’opinion au sein d’un segment où nous
présentons une étude de l'effet linguistique des opérateurs venant
altérer les caractéristiques a priori d'une expression d'opinion :
négations, intensifieurs, modaux. Nous proposons ensuite un modèle de
calcul, d'inspiration géométrique, permettant de déterminer finement
l'impact de ces opérateurs, et ainsi de déterminer les
caractéristiques de l'opinion au niveau du segment.
- Au niveau du document où nous comparons plusieurs approches de
remontée de l'opinion depuis le niveau des segments de discours
jusqu'au niveau du document, afin de calculer l'opinion globale
véhiculée par celui-ci.
-------------------------------------------------------------------------
Message diffuse par la liste Langage Naturel <LN at cines.fr>
Informations, abonnement : http://www.atala.org/article.php3?id_article=48
English version :
Archives : http://listserv.linguistlist.org/archives/ln.html
http://liste.cines.fr/info/ln
La liste LN est parrainee par l'ATALA (Association pour le Traitement
Automatique des Langues)
Information et adhesion : http://www.atala.org/
-------------------------------------------------------------------------
More information about the Ln
mailing list