These: Anna Stavrianou, Modelisation et fouille de discussions du Web
Thierry Hamon
thierry.hamon at UNIV-PARIS13.FR
Sat Jan 23 19:07:38 UTC 2010
Date: Fri, 22 Jan 2010 21:44:52 +0100 (CET)
From: Anna Stavrianou <Anna.Stavrianou at univ-lyon2.fr>
Message-ID: <28571606.239149.1264193094260.JavaMail.root at co4>
Bonjour,
J'ai le plaisir de vous convier à ma soutenance de thèse de doctorat
intitulée « Modeling and Mining of Web Discussions » (Modélisation et
fouille de discussions du Web).
La soutenance aura lieu le lundi 1 février 2010 à 14h00, à la salle de
conférence de l'IUT, 160 BOULEVARD DE L'UNIVERSITE - 69500 BRON
(Campus de Bron de l'Université Lumière Lyon2).
Vous êtes également invités au pot qui suivra.
Composition du jury :
M. GANASCIA Jean-Gabriel, Professeur des universités, Université Paris 6
M. PONCELET Pascal, Professeur des universités, Université Montpellier 2
M. EL-BEZE Marc, Professeur des universités, Université d'Avignon
M. TRAUSAN-MATU Stefan, Professeur des universités, Académie Roumaine
M. CHAUCHAT Jean-Hugues, Professeur des universités, Université Lyon 2
M. VELCIN Julien, Maître de conférences, Université Lyon 2
Bien cordialement,
Anna Stavrianou
*************Résumé**************
Le développement du Web 2.0 a donné lieu à la production d'une grande
quantité de discussions en ligne. La fouille et l'extraction de
données de qualité de ces discussions en ligne sont importantes dans
de nombreux domaines (industrie, marketing) et particulièrement pour
toutes les applications de commerce électronique. Les discussions de
ce type contiennent des opinions et des croyances de personnes et cela
explique l'intérêt de développer des outils d'analyse efficaces pour
ces discussions.
L'objectif de cette thèse est de définir un modèle qui représente les
discussions en ligne et facilite leur analyse. Nous proposons un
modèle basé sur des graphes. Les sommets du graphe représentent les
objets de type message. Chaque objet de type message contient des
informations comme son contenu, son auteur, l'orientation de l'opinion
qui y été exprimée et la date où il a été posté. Les liens parmi les
objets message montrent une relation de type "répondre à". En d'autres
termes, ils montrent quels objets répondent à quoi, conséquence
directe de la structure de la discussion en ligne.
Avec ce nouveau modèle, nous proposons un certain nombre de mesures
qui guident la fouille au sein de la discussion et permettent
d'extraire des informations pertinentes. Les mesures sont définies par
la structure de la discussion et la façon dont les objets messages
sont liés entre eux. Il existe des mesures centrées sur l'analyse de
l'opinion qui traitent de l'évolution de l'opinion au sein de la
discussion. Nous définissons également des mesures centrées sur le
temps, qui exploitent la dimension temporelle du modèle, alors que les
mesures centrées sur le sujet peuvent être utilisées pour mesurer la
présence de sujets dans une discussion.
La représentation d'une discussion en ligne de la manière proposée
permet à un utilisateur de "zoomer" dans une discussion. Une liste de
messages clés est recommandée à l'utilisateur pour permettre une
participation plus efficace au sein de la discussion.
De plus, un système prototype a été implémenté pour permettre à
l'utilisateur de fouiller les discussions en ligne en sélectionnant un
sous ensemble d'objets de type message et naviguer à travers ceux-ci
de manière efficace.
Mots clés : discussions en ligne, opinion mining, fouille de données
d'opinion, text mining, fouille de texte, réseaux sociaux, systèmes de
recommandation, modélisation, forum.
**************Summary**************
The development of Web 2.0 has resulted in the generation of a vast
amount of online discussions. Mining and extracting quality knowledge
from online discussions is significant for the industrial and
marketing sector, as well as for e-commerce applications. Discussions
of this kind encapsulate people's interests and beliefs and hence,
there is a great interest in acquiring and developing online
discussion analysis tools.
The objective of this thesis is to define a model which represents
online discussions and facilitates their analysis. We propose a
graph-oriented model. The vertices of the graph represent
postings. Each posting encapsulates information such as the content of
the message, the author who has written it, the opinion polarity of
the message and the time that the message was posted. The edges among
the postings point out a "reply-to" relation. In other words they show
which posting replies to what as it is given by the structure of the
online discussion.
The proposed model is accompanied by a number of measures which
facilitate the discussion mining and the extraction of knowledge from
it. Defined measures consist in measures that are underlined by the
structure of the discussion and the way the postings are linked to
each other. There are opinion-oriented measures which deal with the
opinion evolution within a discussion. Time-oriented measures exploit
the presence of the temporal dimension within a model, while
topic-oriented measures can be used in order to measure the presence
of topics within a discussion. The user's presence inside the online
discussions can be exploited either by social network techniques or
through the new model which encapsulates knowledge about the author of
each posting.
The representation of an online discussion in the proposed way allows
a user to "zoom" inside the discussion. A recommendation of messages
is proposed to the user to enable a more efficient participation
inside the discussion.
Additionally, a prototype system has been implemented which allows the
user to mine online discussions by selecting a subset of postings and
browse through them efficiently.
Keywords: online discussions, opinion mining, text mining, social
networks, recommender systems, modeling, forums.
-------------------------------------------------------------------------
Message diffuse par la liste Langage Naturel <LN at cines.fr>
Informations, abonnement : http://www.atala.org/article.php3?id_article=48
English version :
Archives : http://listserv.linguistlist.org/archives/ln.html
http://liste.cines.fr/info/ln
La liste LN est parrainee par l'ATALA (Association pour le Traitement
Automatique des Langues)
Information et adhesion : http://www.atala.org/
-------------------------------------------------------------------------
More information about the Ln
mailing list