These: Christophe Vaudable, Analyse et reconnaissance des emotions lors de conversations de centres d'appels

Thierry Hamon thierry.hamon at UNIV-PARIS13.FR
Tue Jul 10 19:49:31 UTC 2012


Date: Mon, 09 Jul 2012 17:30:07 +0200
From: Christophe Vaudable <vaudab at limsi.fr>
Message-ID: <5cd3263cbde7e263311700a6edbe2c08 at limsi.fr>

Bonjour,

J'ai le plaisir de vous inviter à ma soutenance de thèse intitulée
"Analyse et reconnaissance des émotions lors de conversations en centres
d’appels".

La soutenance aura lieu le mercredi 11 juillet à 14h00 dans la salle de
conférence du LIMSI.


Le jury sera composé de :

M. Daniel Luzzati, Professeur, Université du Mans (Rapporteur)

M. Björn Schuller, Maître de conférences HDR, Université de Munich
(Rapporteur)

M. Pierre Zweigenbaum, Directeur de recherche, LIMSI-CNRS (Examinateur)

Mme. Martine Adda-Decker, Directeur de recherche, Université Paris III
Nouvelle Sorbonne (Examinateur)

Mme. Martine Garnier-Rizet, Chercheur, Vecsys (Examinateur)

Mme. Laurence Devillers, Professeur, LIMSI-CNRS (Directeur de thèse)

Bien cordialement,

Christophe Vaudable


==================

Résumé de la thèse

==================

La reconnaissance automatique des émotions dans la parole est un sujet
de recherche relativement récent dans le domaine du traitement de la
parole, puisqu’il est abordé depuis une dizaine d’années environ. Ce
sujet fait de nos jours l’objet d’une grande attention, non seulement
dans le monde académique mais aussi dans l’industrie. Les premiers
travaux étaient fondés sur des données jouées par des acteurs, et donc
non spontanées. Même aujourd’hui, la plupart des études évaluent des
séquences pré-segmentées d’un locuteur unique et non une communication
spontanée qui peut mettre en jeu plusieurs locuteurs. Cette méthodologie
rend les travaux effectués difficilement généralisables pour des
informations collectées de manière naturelle.

Les travaux entrepris dans cette thèse portent sur la détection, via
l’expression émotionnelle, de la satisfaction d’un client lors de
conversations enregistrées en centre d’appels. Dans une première partie
nous présentons les performances pouvant être obtenues sur nos données à
partir de modèles se basant uniquement sur des indices acoustiques ou
lexicaux. Nous montrons que pour obtenir des résultats satisfaisants une
approche ne prenant en compte qu’un seul de ces types d’indices ne
suffit pas. Nous proposons pour pallier ce problème, une étude sur la
fusion d’indices de types acoustiques, lexicaux et
syntaxico-sémantiques.

Dans une seconde partie nous remarquons que même si les modèles hybrides
acoustiques/linguistiques nous permettent d’obtenir des gains de
performance, nos modèles de détection ne sont pas robustes à des données
nouvelles. Pour remédier à ce problème nous proposons une méthode
originale d’enrichissement de notre corpus d’apprentissage. Nous
sélectionnons ainsi, de manière automatique, de nouvelles données qui
seront intégrées dans notre corpus d'entrainement. Cette méthode repose
sur l’utilisation conjointe de méthodes acoustiques et linguistiques.

Enfin, dans une dernière partie nous choisissons d’évaluer nos méthodes
non plus sur des portions de dialogues pré-segmentées mais sur des
conversations complètes. Nous utilisons pour cela les modèles issus des
études précédentes (modèles issus de la fusion d’indices, des méthodes
d’enrichissement automatique) et ajoutons 2 groupes d’indices
supplémentaires : des indices « structurels » prenant en compte des
informations comme la durée de la conversation, le temps de parole de
chaque type de locuteurs et des indices « dialogiques » comprenant des
informations comme le thème de la conversation ainsi qu’un nouveau
concept que nous nommons « implication affective ». Celui-ci a pour but
de modéliser l’impact de la production émotionnelle d’un locuteur sur le
ou les autres participants de la conversation. Nous montrons que lorsque
nous combinons l’ensemble de ces informations nous arrivons à obtenir
des résultats proches de la perception d’un humain lorsqu’il s’agit de
déterminer le caractère positif ou négatif d’une conversation.Le défi
restant sera d’automatiser l’extraction de certains des indices
notamment dialogiques utilisés.

-------------------------------------------------------------------------
Message diffuse par la liste Langage Naturel <LN at cines.fr>
Informations, abonnement : http://www.atala.org/article.php3?id_article=48
English version       : 
Archives                 : http://listserv.linguistlist.org/archives/ln.html
                                http://liste.cines.fr/info/ln

La liste LN est parrainee par l'ATALA (Association pour le Traitement
Automatique des Langues)
Information et adhesion  : http://www.atala.org/
-------------------------------------------------------------------------



More information about the Ln mailing list