Appel: DEFT'09

Thierry Hamon thierry.hamon at LIPN.UNIV-PARIS13.FR
Sat Mar 7 10:21:37 UTC 2009


Date: Fri, 6 Mar 2009 13:51:58 +0100
From: Martine Hurault-Plantet <Martine.Hurault-Plantet at limsi.fr>
Message-Id: <200903061351.58204.Martine.Hurault-Plantet at limsi.fr>
X-url: http://deft09.limsi.fr/
X-url: http://deft09.limsi.fr/index.php?id=2&lang=fr

********************************************************************
DEFT'09   Appel à participation

Atelier d'évaluation en fouille de textes sur 
l'analyse d'opinion multilingue

http://deft09.limsi.fr/

********************************************************************
Dates importantes :

Inscription : à partir du 10 décembre 2008
Diffusion des corpus d'apprentissage : 7 janvier 2009
Test : 3 jours pris entre le 18 mars et le 15 avril 2009
Atelier : 22 juin 2009 (1 journée, dans la Région Parisienne)

********************************************************************
DEFT'09, cinquième édition de la campagne d'évaluation en fouille de
textes DEFT, portera cette année sur l'analyse multilingue d'opinion. 

L'analyse d'opinion, qui a déjà fait l'objet d'une précédente édition
de DEFT, est un thème intéressant à plus d'un titre. Des entreprises
en vivent, parfois même en complément de sondages d'opinion plus
classiques, et le Web fournit des données en abondance, issues de
blogs, de réseaux sociaux, de sites d'évaluation de produits, ou
encore de journaux en ligne. Les applications concernent l'analyse et
le suivi d'une "image" publique ou médiatique, avec des sphères
d'application dans le commerce (image d'un produit,d'un service, d'une
société), la vie publique (image d'une personnalité médiatique) ou
politique (perception d'un projet politique).

Une analyse d'opinion commence par la détection du caractère plus ou
moins subjectif d'un texte ou d'un passage, c'est-à-dire par
déterminer s'il est porteur d'un "sentiment", d'un jugement, d'une
opinion, ou au contraire de données essentiellement factuelles. Les
parties de texte qui contiennent une opinion sont ensuite analysées
pour donner une valeur à l'opinion exprimée, soit suivant une polarité
positive/négative, soit suivant une échelle de valeurs (voir
DEFT'07). Enfin, le jugement exprimé sur un sujet particulier peut
être influencé par, ou laisser transparaître, des opinions d'un type
plus général comme par exemple une opinion politique.

Dans ce cadre, nous proposons trois tâches différentes qui pourront
être effectuées séparément :

- La détection du caractère objectif/subjectif global d'un texte fera
  l'objet d'une première tâche, avec un corpus d'articles de journaux
  français, anglais et italiens, extraits des rubriques suivantes :
  éditoriaux, débats, analyses, actualités en politique nationale et
  internationale et en économie. La référence sera établie suivant le
  type de rubrique projeté sur un espace à deux valeurs
  objectif/subjectif. Par exemple, la rubrique "éditorial", qui
  exprime en général une opinion, est de type "subjectif", et les
  "actualités", décrivant des faits, sont de type "objectif".

- La détection des passages subjectifs d'un texte - que ce texte soit
  globalement objectif ou subjectif - fera l'objet d'une deuxième
  tâche, avec d'une part le même corpus d'articles de journaux, et
  d'autre part un ensemble de débats au parlement européen, en
  français, anglais et italien. La référence sera établie par
  croisement entre les résultats des participants : les passages
  subjectifs seront les portions de texte détectés comme tels par une
  majorité de participants. Le seuil de cette majorité sera déterminé
  de manière empirique au vu des annotations produites par les
  analyseurs.

- La détermination du parti politique auquel appartient l'orateur de
  chaque intervention dans le même ensemble de débats au parlement
  européen que précédemment, fera l'objet de la troisième tâche. Le
  parti sera à déterminer dans un ensemble fermé de partis européens.

Les participants devront effectuer au minimum l'une des trois
tâches. Chaque tâche choisie devra être effectuée au minimum sur le
corpus français.

Les équipes participant à DEFT'09 devront s'inscrire à l'aide du
formulaire en ligne, et signer les accords de restriction d'usage des
corpus (http://deft09.limsi.fr/index.php?id=2&lang=fr).

Des corpus d'apprentissage seront fournis aux participants inscrits, à
partir du 7 janvier 2009. Ces corpus sont composés de 60% des corpus
d'origine. Les 40% de corpus restants seront utilisés pour le test. Le
test aura lieu sur une fenêtre de 30 jours, à partir de la mi-mars. A
partir de la date qu'ils auront choisie dans cet intervalle, les
participants auront trois jours pour appliquer, sur les corpus de
test, les méthodes mises en oeuvre sur les corpus d'apprentissage.

********************************************************************
Comités :

Comité d'organisation :
Co-responsables : Martine Hurault-Plantet, Cyril Grouin
(LIMSI)
Membres : Béatrice Arnulphy, Jean-Baptiste Berthelin, 
Sarra El Ayari, Anne Garcia-Fernandez, Arnaud Grappy,
Isabelle Robba, Pierre Zweigenbaum (LIMSI)

Comité de programme :
Président : Patrick Paroubek (LIMSI)
Membres :
Catherine Berrut (LIG)
Fabrice Clérot (France Telecom)
Guillaume Cleuziou (LIFO)
Béatrice Daille (LINA)
Marc El-Bèze (LIA)
Patrick Gallinari (LIP6)
Thierry Hamon (LIPN)
Fidélia Ibekwe-SanJuan (ELICO)
Pascal Poncelet (LIRMM)
Jean-Michel Renders (XRCE)
Christophe Roche (LISTIC)
Mathieu Roche (LIRMM)
Pascale Sébillot (IRISA)
François Yvon (LIMSI - TLP)

-------------------------------------------------------------------------
Message diffuse par la liste Langage Naturel <LN at cines.fr>
Informations, abonnement : http://www.atala.org/article.php3?id_article=48
English version       : 
Archives                 : http://listserv.linguistlist.org/archives/ln.html
                                http://liste.cines.fr/info/ln

La liste LN est parrainee par l'ATALA (Association pour le Traitement
Automatique des Langues)
Information et adhesion  : http://www.atala.org/
-------------------------------------------------------------------------



More information about the Ln mailing list