stages: France Telecom R&D

Alexis Nasr alexis.nasr at LINGUIST.JUSSIEU.FR
Thu Feb 6 13:13:42 UTC 2003


Analyse de l'expressivité de la parole dans les messages vocaux par
couplage des analyses des intonations et du contenu verbal

Les centres d'appels téléphoniques (centres de réclamation, hot-lines,
etc.) recueillent chaque jour des centaines de messages vocaux
archivés sur répondeur provenant d'appels en période de saturation
(aucun télé-opérateur n'est disponible pour prendre l'appel) ou en
période non ouvrable. Le traitement de ces messages a posteriori est
extrêmement lourd et il peut s'avérer pertinent d'automatiser ce
traitement. Un tel traitement requiert deux types d'analyse : une
analyse du contenu sémantique du message (objet de l'appel) et une
analyse du contenu intonatif (satisfaction, mécontentement,
colère...).

Si des modèles d'analyse du contenu sémantique et intonatif sont
disponibles, ils n'ont pas encore été couplés. Or, la compréhension
complète du message provient de l'analyse conjointe des contenus
sémantique et intonatif réalisés par les auditeurs. Ainsi, il convient
d'étudier le couplage des deux modèles dans le contexte précis de
messages laissés par des clients Orange ayant rencontré des problèmes
avec leur téléphone mobile.

Les différentes tâches à réaliser seront :

Tâche 1 : Etude préparatoire à partir du corpus de messages vocaux
existant

Dans un premier temps, il s'agit de sélectionner, à partir du corpus
existant et de l'expérience des télé-opérateurs, des intonations
particulières dépendant fortement du contenu sémantique (e.g. ironie)
puis de sélectionner un corpus spécifique par intonation retenue. Dans
un deuxième temps, les corpus dédiés seront analysés linguistiquement
de manière à déterminer les mots clés cibles porteurs d'intonations
particulières et les règles linguistiques indicatrices d'intonations
particulières.

Tâche 2 : Création d'un corpus d'étude

Il s'agit de construire des messages où intonations particulières et
contenus sémantiques appropriés sont contrôlés

- création de plusieurs messages (différents contenus sémantiques)

- création d'enregistrements (réalisés par des acteurs) sur répondeur
pour plusieurs intonations fortement dépendantes des contenus
sémantiques

Tâche 3 : Caractérisation du corpus

Il s'agit de caractériser le corpus selon les points de vue suivants :

- subjectif, par réalisation de tests auprès de télé-opérateurs visant
à caractériser le corpus enregistré selon les intonations cibles

- linguistique, par utilisation de la brique de reconnaissance de la
parole afin d'évaluer la pertinence des mots clés ainsi que les règles
linguistiques cibles qui auront été définies

Tâche 4 : Développement du modèle

Il s'agit d'adapter un outil utilisant la triple caractérisation du
corpus afin de prédire les intonations particulières, puis de le
valider et de caractériser ses performances avec un corpus de
validation issu des sous-corpus spécifiques sélectionnés.

Stage d'une durée de 5 à 6 mois.

Contact :
Valérie MAFFIOLO
France Télécom Recherche et Développement
Direction des Interactions Humaines
Evaluation et acceptabilité de la Qualité des Services
2, Avenue Pierre-Marzin
Technopole Anticipa
22307 Lannion Cedex
tél : +33 2 96 05 06 54
fax : +33 2 96 05 13 16
email : valerie.maffiolo at francetelecom.com


-------------------------------------------------------------------------
Message diffusé par la liste Langage Naturel <LN at cines.fr>
Informations, abonnement : http://www.biomath.jussieu.fr/LN/LN-F/
English version          : http://www.biomath.jussieu.fr/LN/LN/
Archives                 : http://listserv.linguistlist.org/archives/ln.html

La liste LN est parrainée par l'ATALA (Association pour le Traitement
Automatique des Langues)
Information et adhésion  : http://www.atala.org/
-------------------------------------------------------------------------



More information about the Ln mailing list