Job: Stage EDF R&D, Adaptation des techniques de text mining aux donnees conversationnelles issues de l'oral

Thierry Hamon thierry.hamon at UNIV-PARIS13.FR
Fri Dec 4 21:18:43 UTC 2009


Date: Fri, 4 Dec 2009 15:24:07 +0100
From: Chloe CLAVEL <chloe.clavel at edf.fr>
Message-ID: <OF0DFA7ABC.B101E874-ONC1257682.004E2F76-C1257682.004F6507 at notes.edfgdf.fr>
X-url: http://liste.cines.fr//ticket/76999844665590
X-url: http://liste.cines.fr//help/admin#moderate


Stage Bac + 5 de 4 à 6 mois au centre de R&D d'EDF de Clamart

Sujet : Adaptation des techniques de text mining aux données 
conversationnelles issues de l'oral 

EDF utilise les techniques de Text Mining pour optimiser sa relation
client, en analysant des questions ouvertes d'enquête de satisfaction,
des textes libres et des retranscriptions de conversations issues des
centres d'appels.

La R&D d’EDF met en œuvre des techniques de text mining sur les
transcriptions de conversations téléphoniques des centres d’appels.
La chaîne de traitement text mining (lemmatisation, extraction de
concept métier, segmentation, classement) permet ainsi de classer ces
transcriptions selon différentes thématiques. Que ces conversations
soient transcrites automatiquement ou manuellement, les entrées de la
chaîne text mining diffèrent de celles classiquement traitées par les
modules de text mining : il s’agit de données issues de l’oral
(transcription littérale manuelle ou automatique) contenant de
nombreuses disfluences comme par exemple : les hésitations, les
bégaiements sur les amorces de mots, les phrases inachevées, les
répétitions de mots ou de groupes de mots.  Ces spécificités liées à
l’oral sont difficiles à traiter, notamment lors de l’étape
d’extraction de concepts métiers (cartouches de connaissance),
extraction qui se fait à l’aide de règles, qui peuvent s’avérer peu
adaptées à des données dont le fenêtrage syntaxique diffère de celui
des données textuelles classiques.

Par ailleurs, les modules de reconnaissance automatique de la parole
utilisés génèrent un certain nombre d’erreurs incluant des erreurs de
ponctuation qui viennent ainsi altérer la transcription.

Dans les deux cas, transcriptions manuelles et automatiques,
l’objectif de se stage sera d’analyser l’impact de l’oral sur la
chaîne text mining et de proposer des alternatives aux méthodes
utilisées jusque maintenant sur des données textuelles.

Profil recherché :

Bac+5, stage de fin d’étude dans le domaine du TALN et/ou du
traitement de la parole.

Contact  et envoi des candidatures :
Chloé Clavel , 01 47 65 43 15, chloe.clavel at edf.fr
Anne Peradotto , 01.47.65.44.89, anne.peradotto at edf.fr
Lieu du stage :  EDF R&D,    1, av du Général de Gaulle,  92141 Clamart 
Cedex
Durée : 6 mois environ
Rémunération : environ 1.000€/mois
  
 
Chloe CLAVEL
Ingénieur chercheur
EDF 
ICAME
1, av. du Général de Gaulle
92141 Clamart
 
chloe.clavel at edf.fr
Tél. : 33 (0)1 47 65 43 15
  
Un geste simple pour l'environnement, n'imprimez ce message que si vous en 
avez l'utilité.


-------------------------------------------------------------------------
Message diffuse par la liste Langage Naturel <LN at cines.fr>
Informations, abonnement : http://www.atala.org/article.php3?id_article=48
English version       : 
Archives                 : http://listserv.linguistlist.org/archives/ln.html
                                http://liste.cines.fr/info/ln

La liste LN est parrainee par l'ATALA (Association pour le Traitement
Automatique des Langues)
Information et adhesion  : http://www.atala.org/
-------------------------------------------------------------------------



More information about the Ln mailing list