Stage: Stage M2 / EDF, Etude des outils de Text Mining
Thierry Hamon
hamon at LIMSI.FR
Sat Jan 18 08:04:45 UTC 2014
Date: Thu, 16 Jan 2014 17:44:11 +0100
From: Delphine LAGARDE <delphine.lagarde at edf.fr>
Message-ID: <OF30299F15.399B64AD-ONC1257C62.005BD493-C1257C62.005BEFDB at notes.edfgdf.fr>
------------------------------------------------------------
STAGE INGÉNIERIE LINGUISTIQUE
SUJET 2014: ÉVALUATION D'OUTILS TEXT MINING
DURÉE : 6 MOIS ENVIRON
1. CONTEXTE
Le volume des données numériques textuelles, disponibles sur l’Internet
(forums, twitters etc.) ou relatives à des contacts client (enquêtes,
centre d’appel etc.), augmente chaque année. L’analyse de ces
informations, structurées ou non, est, aujourd’hui, un impératif
stratégique pour une entreprise telle qu’EDF. Dans ce cadre, et dans
l’objectif de toujours mieux connaître les besoins des clients,
l’exploitation de ces documents implique l’utilisation de méthodes et
d’outils adaptés. Au cœur de ces problématiques les outils de Text
Mining sont de plus en plus nombreux et performants, ainsi nous
souhaitons étudier les principaux outils évoluant sur le marché
aujourd’hui.
2. SUJET DU STAGE
Depuis 2003, les données textuelles sont essentiellement traitées à la
R&D via des solutions développées par l’éditeur TEMIS (Text-Mining
Solution). Ce choix fait suite à différentes campagnes de veille sur
les outils de Text Mining. Un protocole de test d’outils de Text Mining
avait été défini et appliqué à l’étude approfondie de différents
logiciels.
Dans le cadre du suivi des évolutions des outils de Text Mining, nous
souhaitons effectuer une nouvelle évaluation des outils d’analyse de
données contenant du texte.
Ce stage se décomposera en 3 parties :
- Veille d’outils de Text Mining : Il s’agira de mener une étude de
marché des outils existants aujourd’hui.
- Evaluation : A partir des solutions émergentes du marché, il s’agira
d’évaluer une sélection d’outils (entre 3 et 4) jugés à priori
intéressants par rapport aux besoins d’EDF.
- Perspectives : Dans un second temps, il s’agira d’identifier les
perspectives envisageables quant à l’alliance du Text Mining et du Web
sémantique au regard des besoins EDF.
INFORMATIONS PRATIQUES
Interlocuteurs:
Delphine Lagarde 01.47.65.39.75 delphine.lagarde at edf.fr
Anne Peradotto 01.47.65.44.89 anne.peradotto at edf.fr
Lieu du stage:
EDF R&D – Département ICAME
1, avenue du Général de Gaulle
92141 Clamart Cedex
Date & Durée : Début 2014 - 6 mois environ
Rémunération: A définir (environ 1.000€/mois)
-------------------------------------------------------------------------
Message diffuse par la liste Langage Naturel <LN at cines.fr>
Informations, abonnement : http://www.atala.org/article.php3?id_article=48
English version :
Archives : http://listserv.linguistlist.org/archives/ln.html
http://liste.cines.fr/info/ln
La liste LN est parrainee par l'ATALA (Association pour le Traitement
Automatique des Langues)
Information et adhesion : http://www.atala.org/
ATALA décline toute responsabilité concernant le contenu des
messages diffusés sur la liste LN
-------------------------------------------------------------------------
More information about the Ln
mailing list