Sujet de these: These Cifre sur les systemes de dialogue, Orange Labs

Thierry Hamon hamon at LIMSI.FR
Sun Apr 6 08:14:34 UTC 2014


Date: Wed, 2 Apr 2014 14:20:52 +0000
From: <romain.laroche at orange.com>
Message-ID: <14173_1396448453_533C1CC5_14173_4668_1_6A3EA12B995B52459CDFCEFF0835C6B113FDB04E at PEXCVZYM12.corporate.adroot.infra.ftgroup>
X-url: http://www.intelliagence.fr/Page/Offer/ShowOffer.aspx?OfferId=55930
X-url: http://www.expectlabs.com/mindmeld/


Bonjour,

L'équipe NaDia (Natural Dialogue) d'Orange Labs propose une thèse à
démarrer en Octobre 2014 sur son site d'Issy les Moulineaux.

Sujet de thèse : Dialogues intelligents basés sur l’écoute de
conversations homme/homme
Pour postuler :
http://www.intelliagence.fr/Page/Offer/ShowOffer.aspx?OfferId=55930

Vous trouverez l'intégralité du sujet de thèse en dessous de ma
signature,

Cordialement,

Romain Laroche


####################################

Positionnement du sujet vis-à-vis de la stratégie d’entreprise et du
programme de recherche

Orange Labs s'intéresse depuis longtemps aux systèmes de dialogues,
notamment pour tout ce qui ressort du domaine des services
vocaux. Aujourd'hui, la technologie Disserto est fortement axée sur le
dialogue en langue naturelle. Elle a déjà servi à développer des
services de qualification d'appel (Générali, Crédit Agricole Centre
Ouest, la Banque Postale), l'annuaire téléphonique interne, les services
téléphoniques automatisés d’Orange (le 3000, le 3900, le 1013), …

La solution de dialogue Disserto est une chaîne d'outils complète
destinée à la conception, au développement et à la production de
services vocaux interactifs. L'utilisateur peut interagir avec
l'application soit en pressant les touches du téléphone (DTMF), soit en
prononçant des commandes vocales. Ces commandes vocales peuvent être
soit en mots isolés, en mots connectés, ou alors en parole continue
associée à un analyseur sémantique. Cette dernière modalité permet des
applications dites en langage naturel. L'application rétroagit vers
l'utilisateur en émettant des messages sonores préenregistrés, en
synthèse de la parole ou par un autre mode de communication (texte,
graphique, …).

description de l’équipe

Le candidat sélectionné sera intégré à l’équipe NaDia (Natural
Dialogue), constituée à ce jour de 8 permanents, 3 doctorants et 1
postdoctorant. La moitié de l’effort porte sur le développement et
l’autre moitié sur l’innovation et la recherche. L’équipe est bi-site ;
le doctorant sera donc amené à faire des missions à Lannion.

####################################

contexte global du sujet de thèse

La reconnaissance vocale est une boîte noire permettant de transcrire de
la parole en texte. Sa robustesse, sa précision et sa généricité ont
énormément progressé ces dernières années, si bien qu’il est maintenant
possible de l’utiliser sur un modèle de langage générique, même dans un
environnement bruyant. Cette avancée technologique pousse de nombreuses
innovations dont la famille d’applications qui nous intéressera lors de
cette thèse : l’écoute active d’une conversation homme-homme pour en
extraire du sens et fournir un service contextuel à ce sens.

En interne, nous avons déjà travaillé sur un service de ce type dans le
service de contextualisation qui est intégré dans l’environnement de
travail d’un télé-conseiller de centre d’appel. Cet environnement
embarque plusieurs services métiers : le chat, le mail, la gestion
d’appel, la prise de rendez-vous, la localisation, le CRM, le scripting,
les statistiques, etc. L’outil de contextualisation consiste donc à
guider l’agent en lançant automatiquement ou semi-automatiquement des
applications en fonction de motifs conversationnels détectés dans la
communication.

De même, un assistant personnel du nom de MindMeld
(http://www.expectlabs.com/mindmeld/) est commercialisé depuis peu. Il
écoute les conversations téléphoniques et propose en temps réel des
contenus en rapport avec les sujets abordés.

Le sujet de la thèse se focalisera sur la partie dialogique (relevant du
dialogue), à savoir d’une part, de ne pas seulement reconnaitre des
mots-clefs ou même analyser des phrases, mais inscrire l’analyse dans un
modèle de dialogue homme-homme ; et d’autre part, de ne pas seulement
afficher une information, ou proposer une action, mais initier un
dialogue avec l’utilisateur, terrains qu’aucune recherche ou
application, à notre connaissance, n’ont investi à ce jour.

Le domaine scientifique de la thèse sera donc à cheval sur l’analyse
sémantique d’un dialogue homme-homme et les systèmes de dialogue
homme-machine. Ceux-ci incluent depuis plusieurs années les systèmes
vocaux interactifs, mais aussi les chatbots ou les interactions que
certains jeux vidéo proposent entre le joueur et certains
personnages. Les systèmes de dialogue vocal sont en plein essor et
traitent maintenant commercialement plusieurs milliards d’appels par an.

####################################

objectif scientifique de la thèse - verrous à lever

Les thématiques scientifiques de la thèse s’articulent autour de trois
sujets principaux bien disjoints :

- Comment modéliser l’analyse sémantique d’une conversation homme-homme
  et en extraire un sens utilisable par une application ?  Contrairement
  à une application de dialogue classique, le système doit être capable
  d’interpréter les questions et les réponses et de construire une
  représentation de la conversation de manière incrémentale, au fur et à
  mesure qu’elle se déroule, et ce, en temps réel.

- Comment initier, mener et conclure un dialogue avec un utilisateur qui
  est déjà engagé dans une conversation avec une autre personne ?
  Contrairement à un dialogue bipartite classique, l’utilisateur peut
  s’adresser soit au système soit à son interlocuteur. De plus, la
  gestion simultanée de deux dialogues risque de modifier les codes
  interactionnels.

- Comment rendre ce type d’application d’écoute et de dialogue
  facilement extensible, voire personnalisable ? Nous prévoyons que la
  famille d’applications de dialogue développée lors de la thèse
  regroupe pour une majeure partie des applications auxquelles on
  souhaitera rajouter incrémentalement des fonctionnalités. Il apparait
  même qu’un assistant personnel devrait être personnalisable par chaque
  utilisateur. 

Nous demanderons également au doctorant d’assurer le prototypage d’une
ou plusieurs applications et d’organiser des campagnes d’expérimentation
pour évaluer les résultats de ses travaux.

En revanche, les sujets suivants sont hors du périmètre : optimisation
de la reconnaissance vocale ou théorisation de la multimodalité.

####################################

Profil des candidats :
compétences (scientifiques et techniques) et qualités personnelles
souhaitées par le poste 

- Savoir :
  - informatique théorique,
  - intelligence artificielle, 
  - philosophie du langage,
  - architecture logicielle,
- Savoir être :
  - esprit critique et ouvert,
  - pragmatisme
- Savoir faire :
  - créativité,
  - organisation,
  - vulgarisation,
  - propreté du code
  - informatique pratique,
  - développement informatique,
  - rigueur de développement,
  - sûreté du code développé,
  - maîtrise de l’anglais,
  - rigueur théorique,
  - rigueur de présentation,
  - rigueur scientifique,
  - rédaction

Spécialités, 
- Dialogue naturel écrit et parlé
- Théorie des jeux, jeu algorithmique et « mechanism déesign »
- Interaction multimodale
- Traitement automatique de la langue : lemmatisation, génération

Formation demandée, 
- Master de recherche et/ou diplôme d’ingénieur de première catégorie
- Au moins une des spécialités décrites ci-dessus inscrites au cursus
  universitaire/scolaire du candidat

Expériences souhaitées, 
- Un stage dans une des spécialités mentionnées ci-dessus, ou en
  intelligence artificielle au sens large

####################################

Le plus de l’offre 

Cette thèse offre l’opportunité de contribuer au futur des applications
de dialogue, et de participer à démocratisation des systèmes vocaux dans
la vie tous les jours. Ces deux domaines sont en plein essor
actuellement et leur émergence semble inéluctable dans les dix années à
venir. Selon Gartner, les assistants personnels font partie du top10 des
tendances technologiques pour 2014 à travers la thématique des « smart
machines ».

Le doctorant est intégré dans une petite équipe comprenant trois autres
doctorants et un post-doctorant à ce jour. Toute l’équipe travaille dans
le domaine des systèmes de dialogue. Les autres équipes d’Orange Labs
regroupent tous types de compétences dans tous les domaines de
l’intelligence artificielle et plus généralement de
l’informatique. C’est un très bon environnement pour aller au fond de
ses recherches et obtenir un retour avisé d’experts.

Orange garantit que le doctorant travaillera dans les meilleures
conditions en prenant plusieurs engagements :

- Mise à disposition d’outils industriels : l’outil historique Disserto,
  utilisé par le thésard, offre les clés idéales pour aborder toutes ces
  problématiques sans avoir à passer trop de temps sur du développement
  périphérique au sujet de thèse.

- Mise à disposition de nos précédents résultats de recherche : qu’il
  s’agisse de veille, d’étude théorique ou de code, le doctorant aura
  accès à toutes les ressources qui peuvent l’aider dans sa
  tâche. Orange Labs regroupe 3700 ingénieurs. Quel que soit la
  thématique de recherche, il est probable qu’elle ait été défrichée
  quelque part.

- Mise à disposition des équipements nécessaires : pour l’étude du
  dialogue dans l’environnement domestique, nous avons déjà investi sur
  de l’équipement pour monter une showroom.

- Mise en place d’expérimentations : nous avons l’habitude chez Orange
  de lancer des campagnes de tests de nos développements en
  interne. Chaque campagne a ses spécificités, mais pour donner une idée
  de l’ampleur, nous avons un doctorant pour lequel trois
  expérimentations de 500 testeurs sont planifiés sur la durée de la
  thèse.

- Mise à disposition de données : Orange a une grande expérience en
  matière de systèmes vocaux et dispose de grandes quantités de données
  (les systèmes basés sur la technologie Disserto reçoivent 200 millions
  d’appels par an).

-------------------------------------------------------------------------
Message diffuse par la liste Langage Naturel <LN at cines.fr>
Informations, abonnement : http://www.atala.org/article.php3?id_article=48
English version       : 
Archives                 : http://listserv.linguistlist.org/archives/ln.html
                                http://liste.cines.fr/info/ln

La liste LN est parrainee par l'ATALA (Association pour le Traitement
Automatique des Langues)
Information et adhesion  : http://www.atala.org/

ATALA décline toute responsabilité concernant le contenu des
messages diffusés sur la liste LN
-------------------------------------------------------------------------



More information about the Ln mailing list