Stage: Stage M2 / EDF, Etude des outils de Text Mining

Thierry Hamon hamon at LIMSI.FR
Sat Jan 18 08:04:45 UTC 2014


Date: Thu, 16 Jan 2014 17:44:11 +0100
From: Delphine LAGARDE <delphine.lagarde at edf.fr>
Message-ID: <OF30299F15.399B64AD-ONC1257C62.005BD493-C1257C62.005BEFDB at notes.edfgdf.fr>


------------------------------------------------------------

STAGE INGÉNIERIE LINGUISTIQUE
SUJET 2014: ÉVALUATION D'OUTILS TEXT MINING
DURÉE : 6 MOIS ENVIRON

1.  CONTEXTE

Le volume des données numériques textuelles, disponibles sur l’Internet
(forums, twitters etc.) ou relatives à des contacts client (enquêtes,
centre d’appel etc.), augmente chaque année. L’analyse de ces
informations, structurées ou non, est, aujourd’hui, un impératif
stratégique pour une entreprise telle qu’EDF. Dans ce cadre, et dans
l’objectif de toujours mieux connaître les besoins des clients,
l’exploitation de ces documents implique l’utilisation de méthodes et
d’outils adaptés. Au cœur de ces problématiques les outils de Text
Mining sont de plus en plus nombreux et performants, ainsi nous
souhaitons étudier les principaux outils évoluant sur le marché
aujourd’hui.

2.  SUJET DU STAGE

Depuis 2003, les données textuelles sont essentiellement traitées à la
R&D via des solutions développées par l’éditeur TEMIS (Text-Mining
Solution).  Ce choix fait suite à différentes campagnes de veille sur
les outils de Text Mining.  Un protocole de test d’outils de Text Mining
avait été défini et appliqué à l’étude approfondie de différents
logiciels.

Dans le cadre du suivi des évolutions des outils de Text Mining, nous
souhaitons effectuer une nouvelle évaluation des outils d’analyse de
données contenant du texte.

Ce stage se décomposera en 3 parties :

- Veille d’outils de Text Mining : Il s’agira de mener une étude de
  marché des outils existants aujourd’hui.

- Evaluation : A partir des solutions émergentes du marché, il s’agira
  d’évaluer une sélection d’outils (entre 3 et 4) jugés à priori
  intéressants par rapport aux besoins d’EDF.

- Perspectives : Dans un second temps, il s’agira d’identifier les
  perspectives envisageables quant à l’alliance du Text Mining et du Web
  sémantique au regard des besoins EDF.

INFORMATIONS PRATIQUES

Interlocuteurs:
Delphine Lagarde        01.47.65.39.75  delphine.lagarde at edf.fr
Anne Peradotto  01.47.65.44.89  anne.peradotto at edf.fr

Lieu du stage: 
EDF R&D – Département ICAME
1, avenue du Général de Gaulle
92141 Clamart Cedex 

Date & Durée : Début 2014 - 6 mois environ

Rémunération: A définir (environ 1.000€/mois)

-------------------------------------------------------------------------
Message diffuse par la liste Langage Naturel <LN at cines.fr>
Informations, abonnement : http://www.atala.org/article.php3?id_article=48
English version       : 
Archives                 : http://listserv.linguistlist.org/archives/ln.html
                                http://liste.cines.fr/info/ln

La liste LN est parrainee par l'ATALA (Association pour le Traitement
Automatique des Langues)
Information et adhesion  : http://www.atala.org/

ATALA décline toute responsabilité concernant le contenu des
messages diffusés sur la liste LN
-------------------------------------------------------------------------



More information about the Ln mailing list