Appel: Workshop Fouille d=?WINDOWS-1252?Q?=92opinion_?=dans le Web social

Thierry Hamon hamon at LIMSI.FR
Fri Jan 10 20:58:40 UTC 2014


Date: Fri, 10 Jan 2014 13:55:59 +0100
From: Caroline Brun <Caroline.Brun at xrce.xerox.com>
Message-ID: <52CFEDDF.40005 at xrce.xerox.com>
X-url: http://mediamining.univ-lyon2.fr/people/velcin/fows
X-url: http://web-intelligence-rhone-alpes.org)
X-url: http://www.arc6-tic.rhonealpes.fr),
X-url: http://bdaille.com)
X-url: http://www.ho2s.com/fr)
X-url: http://www2.lirmm.fr/~mroche)
X-url: http://mathieu.valette.free.fr)


WORKSHOP Fouille d’opinion dans le Web social

##Supports :
Projet Web Intelligence de la région Rhône-Alpes, ARC6

##Organisateurs :
C. Brun (Xerox Research Center Europe, Grenoble)
J. Velcin (Université Lyon 2, Laboratoire ERIC, Lyon)

##Site web :
http://mediamining.univ-lyon2.fr/people/velcin/fows   

##Date et lieu :
jeudi 10 avril 2014, Institut des Sciences de l’Homme (Lyon).

##Contexte et objectifs :
Le Web social a vu une explosion des données générées par les individus
: réseaux sociaux (Facebook, Google+, Linked'in), blogs et micro-blogs
(MySpace, Twitter), discussions en lignes (forums). Il y a aujourd'hui
un intérêt crucial à développer de nouveaux outils afin d'exploiter
intelligemment cette source inestimable d'information. Dans cette
journée thématique, nous nous intéressons en particulier à l'analyse des
données liées à l'opinion ou aux sentiments exprimés par les internautes
au sein de ces réseaux d'information. L'exploitation de ces données a
permis, récemment, d'obtenir des résultats remarquables dans le domaine
du marketing (recommandation de produits), de la politique (prévision de
sondages), menant vers de nombreuses applications : personnalisation des
services, marketing, veille d'information, gestion de la e-reputation,
gestion de la relation clients, etc.

Cette journée, organisée dans le cadre du projet WI de la région
Rhône-Alpes (http://web-intelligence-rhone-alpes.org) et de l’ARC6
(http://www.arc6-tic.rhonealpes.fr), a trois objectifs :

1) Présenter quelques avancées récentes en matière de fouille des
   données d’opinion et de sentiments issues du Web.

2) Croiser les regards en invitant des chercheurs issus de différents
   horizons (académiques, industriels, informaticiens, linguistes).

3) Partager l’expérience acquise sur différents projets de recherche
   (sur les données, et notamment leur annotation, les algorithmes
   employés, les résultats obtenus et espérés, la nature des consortiums
   déployés).


##Programme (provisoire) :
Quatre conférenciers ont déjà confirmé leur participation à cette
journée :

- Béatrice Daille, LINA, Université de Nantes (http://bdaille.com)

Résumé:
Avec l'essor du web, les opinions exprimées sur internet sont devenues
des données stratégiques qu'il faut pouvoir suivre en temps réel et
caractériser finement. Dans le cadre du projet ANR Blogoscopie, nous
avons développé l'outil Apopsis chargé de détecter les opinions
exprimées localement dans les blogs quelle que soit la thématique et de
les catégoriser en fonction de leur orientation positive ou
négative. Cet outil s'appuie sur une grammaire de l'opinion incluant des
étiquettes sémantiques reflétant les différentes catégories d'opinions
émises. Cette grammaire a été élaborée à partir de deux ressources
linguistiques : un corpus de référence annoté et un lexique de
l'opinion. Apopis est précis pour la détection et l'orientation des
opinions évaluatives mais la variété des expressions évaluatives reste
un frein à une détection exhaustive. Apopsis permet aussi la détection
des opinions émises sur les tweets en temps réel pour un sujet choisi
par l'utilisateur au travers d'une interface web.

- Luca Dini, Président de Holmes Semantic Solution
  (http://www.ho2s.com/fr)

Résumé
L'insoutenable légèreté des jugements de l'utilisateur. Au cours des
dernières années, nous avons observé deux tendances parallèles dans la
recherche en linguistique computationnelle et le développement du
commerce électronique. Du côté de la recherche, il y a eu un intérêt
croissant pour les algorithmes et les approches qui sont en mesure de
capter la polarité des opinions exprimées par les utilisateurs sur les
produits, les institutions et les services. De l'autre côté, presque
tous les grands sites de commerce électronique et d'agrégation de
contenu offrent désormais aux utilisateurs la possibilité d'écrire des
commentaires et d'exprimer leur appréciation via un score numérique
(généralement représentée sous la forme d'un nombre d'étoiles). Cette
présentation décrira une expérience à grande échelle visant à détecter
la fiabilité des utilisateurs lors de la conversion de leurs opinions
écrites sur le produit en un score numérique (nombre d'étoiles). Nous
allons montrer que, en raison d'un certain nombre de facteurs, un tel
jugement est très peu fiable et que, confronté à un "gold standard"
uniforme, il offre une précision inférieure à un système de pointe
spécialisé dans la détection d'opinions.

- Mathieu Roche, CIRAD, TETIS Lab, Montpellier
  (http://www2.lirmm.fr/~mroche)

Résumé
L'analyse de sentiment est un domaine de recherche en développement
constant ces dernières années. Les analyses proposées reposent souvent
sur l'utilisation d'un vocabulaire d'opinion adapté au domaine
d'étude. Cette présentation décrira deux types de méthodes non
supervisées afin de construire un vocabulaire d'opinion dédié. Celles-ci
s'appuient sur la combinaison d'approches de fouille de textes et/ou de
fouille du Web. Les avantages et les limites de ces approches seront
discutés dans le cadre de cette présentation. Une partie de ces méthodes
sont intégrées au projet SENTERRITOIRE (projet soutenu par la MSH-M,
[2011-2014]) dont l'objectif est de proposer un environnement
décisionnel fondé sur une analyse automatique des textes liés à
l'aménagement du territoire. Le projet se concentre, dans un premier
temps, sur l'extraction automatique des descripteurs géospatiaux. Ces
derniers sont par la suite enrichis par des informations caractérisant
plus largement le concept de "territoire" afin d'analyser
automatiquement l'utilisation de ces concepts dans les textes, et les
perceptions qu'ils véhiculent.

- Mathieu Valette, INALCO, équipe ERTIM, Paris
  (http://mathieu.valette.free.fr)

La fouille d'opinion et l'analyse des sentiments reposent sur
l'identification de marques linguistiques de la subjectivité. Selon une
lecture positiviste répandue, celle-ci serait en effet fondée sur des
valeurs, par opposition aux faits objectifs traditionnellement
privilégiés en extraction de connaissances. Mais la plupart des méthodes
de détection de la subjectivité reposent, par imitation, sur
l'établissement de lexiques axiologiques qui constituent des bases de
connaissances que l'on projette ensuite sur les documents traités. Notre
propos est d'envisager l'expression des opinions et des sentiments à
partir d'une caractérisation globale des textes qui, à des fins
expérimentales, s'affranchisse le plus possible des lexiques préétablis,
pour se focaliser sur l'identification de descripteurs
alternatifs. Parmi ces descripteurs, on s'intéressera plus
particulièrement à la caractérisation des genres textuels (par exemple,
le pamphlet est dévolu à la critique négative) et au positionnement
énonciatif des auteurs (par exemple, expression de la temporalité vécue,
aspectualité, rôles et interactions des acteurs).

Le programme détaillé de la journée sera communiqué ultérieurement.

##Appel à communications :
Nous sollicitons des contributions relatives à des travaux récents dans
le domaine de la fouille d’opinion et de sentiment, en particulier
centrés sur des données issues du Web. Les présentations seront faites
sous forme de communications orales de 15 minutes (et éventuellement de
posters, suivant le nombre de soumissions).

La sélection des présentations sera faite sur la base d’un résumé
d’environ 2000 mots (3 pages), en français ou en anglais, sur des thèmes
liés à la fouille d’opinion sur le Web et dans les réseaux sociaux. Les
auteurs sont tout d’abord invités à indiquer leur intention de soumettre
une communication en envoyant un premier résumé d’environ 500
caractères. Les fichiers envoyés sur le site de soumission Easychair
doivent être au format PDF. Chaque résumé sera évalué par deux membres
du comité de lecture.

##Site de soumission des propositions :
https://www.easychair.org/conferences/?conf=opweb14

##Dates :
- Soumission du premier résumé (maximum 500 caractères) : 23 janvier
- Soumission du  résumé final (maximum 2000 mots) : 6 février
- Notification aux auteurs : 28 février
- Date du workshop : 10 avril

##Comité de lecture
- Patrice Bellot (LSIS, Aix-Marseille)
- Stéphane Bonnevay (ERIC, Lyon 1)
- Caroline Brun (XRCE, Grenoble)
- Marc El-Bèze (LIA, Avignon)
- Chloé Clavel (Telecom ParisTech, Paris)
- Leila Khouas (AMI Sofware, Montpellier)
- Christine Largeron (LHC, St-Etienne)
- Marie-Jeanne Lesot (LIP6, Paris)
- Sabine Loudcher (ERIC, Lyon 2)
- Claude Roux (XRCE, Grenoble)
- Anna Stavrianou (XRCE, Grenoble)
- Maguelonne Teisseire (IRSTEA, Montpellier)
- Julien Velcin (ERIC, Lyon 2)

##Contacts :
caroline.brun at xrce.xerox.com
julien.velcin at univ-lyon2.fr

# LES FORUMS WEB INTELLIGENCE

Les forums web Intelligence sont des occasions de rencontres et
d'échanges entre chercheurs, industriels et associations/collectivités,
intéressés par le thème du Web, de son développement et de son usage, en
lien avec les techniques d'intelligence artificielle. Outre la synergie
triangulaire entre académiques, industriels et
associations/collectivités, les forums sont également des opportunités
pour sensibiliser les étudiants à la recherche, et pour permettre à des
doctorants de s'insérer dans la communauté scientifique et d'y
contribuer progressivement.

##Les dates à retenir :
- 6 février, St Etienne, Cité du Design (Auditorium) : Web et Design
- 27 mars, Lyon, Manufacture des Tabacs (amphi Malraux) : Environnement
  cloud et multi-clouds
- 10 avril , Lyon (ISH) : Fouille d’opinion dans le Web social
- 19 juin, Futur du Web

-------------------------------------------------------------------------
Message diffuse par la liste Langage Naturel <LN at cines.fr>
Informations, abonnement : http://www.atala.org/article.php3?id_article=48
English version       : 
Archives                 : http://listserv.linguistlist.org/archives/ln.html
                                http://liste.cines.fr/info/ln

La liste LN est parrainee par l'ATALA (Association pour le Traitement
Automatique des Langues)
Information et adhesion  : http://www.atala.org/

ATALA décline toute responsabilité concernant le contenu des
messages diffusés sur la liste LN
-------------------------------------------------------------------------



More information about the Ln mailing list