Sujet de these: Systemes de dialogue, Orange Labs, Lannion

Thierry Hamon thierry.hamon at UNIV-PARIS13.FR
Wed Oct 23 21:27:44 UTC 2013


Date: Wed, 23 Oct 2013 16:19:07 +0000
From: <romain.laroche at orange.com>
Message-ID: <25767_1382545147_5267F6FB_25767_8258_1_6A3EA12B995B52459CDFCEFF0835C6B10CE223 at PEXCVZYM12.corporate.adroot.infra.ftgroup>
X-url: http://intelliagence.fr/Page/Offer/ShowOffer.aspx?OfferId=53058


Titre de l'offre de thèse : « Fusion d'applications de dialogue
concurrentes »
URL où postuler :
http://intelliagence.fr/Page/Offer/ShowOffer.aspx?OfferId=53058

Type d'offre : Offre de thèse
Financement : Public/Privé : Thèse Cifre chez Orange
Etablissement d'accueil : Orange Labs
Lieu de travail : Lannion - France
Spécialité : Informatique, électronique - Informatique et applications -
Mathématiques 

Description de l'équipe : 
L'équipe NADIA est spécialisée en systèmes de dialogue en langage
naturel. 
Elle accompagne des projets afin de mettre en place du dialogue dans
leurs applications grâce à la suite logicielle Disserto (domaines
applicatifs très larges : distribution de contenus riches, M2M,
environnement domestique, etc.).
L'activité de l'équipe est répartie entre la Recherche et le
Développement.


Contexte global de l'étude et état de l'art :
Le travail de thèse porte sur le domaine des systèmes de
dialogue. Ceux-ci incluent depuis plusieurs années les systèmes vocaux
interactifs, mais aussi les chatbots ou les interactions que certains
jeux vidéos proposent entre le joueur et certains personnages. De
nombreux travaux scientifiques et de développement industriel ont été
réalisés dans ce domaine, incluant des modèles très différents :
systèmes à base d'automates, systèmes multi-agents, systèmes articulés
autour d'une base de connaissance logique, systèmes générés
automatiquement par optimisation statistique, ou encore plus récemment
systèmes de dialogue incrémentaux, basés sur une architecture
incrémentale. Même si l'on ne prend en compte que les systèmes vocaux,
ils traitent maintenant plusieurs milliards d'appels par an.

Traditionnellement, les systèmes de dialogue sont accessibles via un URL
ou un numéro d'appel. Les applications ne sont donc pas en
concurrence. Mais récemment, nous voyons apparaître de plus en plus
d'assistants personnels : sur le mobile, dans la voiture, dans la
maison. Le périmètre applicatif de ces assistants est mal défini,
puisqu'on aimerait d'une part qu'ils sachent tout faire et d'autre part,
nous savons les limites des systèmes de dialogue et le temps nécessaire
au développement de chaque service.

Notre approche consiste à ne plus considérer l'assistant comme une
application de dialogue, mais comme un portail pointant vers un bouquet
d'applications. Ce bouquet est composé par l'utilisateur, en fonction de
ses usages. Cette architecture suppose que l'on soit capable d'articuler
les applications les unes avec les autres. C'est le sujet de la thèse.

Positionnement du sujet vis-à-vis de la stratégie d'Orange et du TC
Orange Labs s'intéresse depuis longtemps aux systèmes de dialogues,
notamment pour tout ce qui ressort du domaine des services
vocaux. Aujourd'hui, la technologie Disserto est fortement axée sur le
dialogue en langue naturelle.

La solution de dialogue Disserto est une chaîne d'outils complète
destinée à la conception, au développement et à la production de
systèmes de dialogue interactifs.

La chaîne Disserto est composée des outils suivants:

- Dialog Design Studio (DDS), pour la conception du dialogue,

- Dialog Analyser Studio (DAS), permettant la mise au point de règles
  sémantiques,

- Dialog Code Generator (DCG), un générateur XML à partir du DDS et de
  codes Java.

De plus, Disserto est composée des composants suivants pour le cycle de
production:

- un Analyseur Sémantique (AS), qui produit une ou plusieurs étiquettes
  sémantiques qui vont permettre d'orienter la suite du dialogue,

- un Moteur de Phases (MP), qui fait tourner l'application vocale et
  produit à la volée les pages VoiceXML décrivant l'interaction vocale.

La thèse devra se baser sur cet existant technologique pour déterminer
un processus de fusion d'applications de dialogue.

Description du sujet de thèse :
Outre les problèmes d'ingénierie, le sujet sur lequel la thèse devra se
poser longuement est la question de comment, d'une part, laisser aux
applications le moyen de définir les modèles de langage (pour les
services vocaux) et les règles sémantiques pour accéder à leur service ;
et d'autre part, s'assurer qu'une application malveillante ne puisse
rediriger vers elle toutes les requêtes de l'utilisateur. 

Dans le cas d'un système de dialogue vocal, cette tâche implique un
travail sur la fusion des modèles de langage de la reconnaissance
vocale. C'est relativement simple lorsque celui-ci est défini en mode
binaire (un énoncé donné est soit possible, soit impossible), puisqu'il
suffit alors de faire l'union des modèles de langage de chaque
application. C'est un peu plus complexe lorsque les modèles de langage
sont statistiques (n-best) et encore plus quand ceux-ci sont hétérogènes :
certaines applications ont des modèles binaires et les autres des
modèles statistiques.

Pour les applications de dialogue en langage naturel (vocal ou écrit),
la fusion des analyseurs sémantiques de chaque application est plus
complexe et sera probablement l'objet de recherche principal de la
thèse. Le travail du thésard consistera donc à théoriser la
problématique, définir un ensemble de méthodes, concevoir et optimiser
les algorithmes implémentant chaque méthode, et effectuer un benchmark
pour déterminer la meilleure solution.

D'autres tâches plus périphériques seront également à planifier, telles
que :

- la définition de commandes universelles à toutes les applications,

- la conception de techniques pour s'assurer que ces commandes soient
  accessibles à n'importe quel moment, depuis n'importe quelle
  application,

- la conception de ponts entre les applications,

- le développement d'un template pour certifier la compatibilité d'une
  application avec le portail d'application, et pour aider les
  développeurs dans leurs implémentations.

A notre connaissance, la fusion d'applications de dialogue, vocales,
écrites ou multimodales, est une nouvelle thématique de recherche,
n'ayant pas de précédent dans l'état de l'art. L'étude des états de
l'art plus généraux des systèmes vocaux et du traitement automatique des
langues naturelles sera toutefois capitale pour avoir une vue d'ensemble
et être capable de mener un benchmark le plus rigoureux possible.

Orange garantit que le doctorant travaillera dans les meilleures
conditions en prenant plusieurs engagement :

- Mise à disposition d'outils industriels : l'outil historique Disserto,
  utilisé par le thésard, offre les clés idéales pour aborder toutes ces
  problématiques sans avoir à passer trop de temps sur du développement
  périphérique au sujet de thèse.

- Mise à disposition de nos précédents résultats de recherche : qu'il
  s'agisse de veille, d'étude théorique ou de code, le doctorant aura
  accès à toutes les ressources qui peuvent l'aider dans sa
  tâche. Orange Labs regroupe 3700 ingénieurs. Quel que soit la
  thématique de recherche, il est probable qu'elle ait été défrichée
  quelque part.

- Mise en place d'expérimentations : nous avons l'habitude chez Orange
  de lancer des campagnes de tests de nos développements en
  interne. Chaque campagne a ses spécificités, mais pour donner une idée
  de l'ampleur, nous avons un doctorant pour lequel trois
  expérimentations de 500 testeurs sont planifiés sur la durée de la
  thèse.

- Mise à disposition de données : Orange a une grande expérience en
  matière de systèmes vocaux et dispose de grandes quantités de données
  (les systèmes basés sur la technologie Disserto reçoivent 200 millions
  d'appels par an).

Cette thèse offre l'opportunité de contribuer au futur des applications
de domotique, et de participer à démocratisation des systèmes vocaux
dans la vie tous les jours. Ces deux domaines sont en plein essor
actuellement et leur émergence semble inéluctable dans les dix années à
venir.



Profil des candidats :
Ingénieur en informatique ayant un bon niveau d'anglais et de
l'expérience dans un ou plusieurs des domaines suivants :
- analyse sémantique,
- statistiques, probabilités,
- traitement automatique des langues naturelles,
- apprentissage automatique,
- systèmes de dialogue.

Le candidat devra être capable de développer lui-même ses algorithmes en
Java.

Les qualités non techniques suivantes seront appréciées :
- esprit critique et ouvert,
- organisation,
- maîtrise de l'anglais,
- pragmatisme,
- créativité,
- rigueur théorique et scientifique,
- capacité à valoriser ses travaux : rédaction, et qualité de
  présentation

Le candidat disposera des facultés pour aborder les domaines de
recherche suivants : les systèmes de dialogue, le traitement automatique
des langues naturelles, le spoken language understanding (compréhension
de la langue parlée), l'apprentissage automatique, les services vocaux
et l'architecture logicielle.

Approche méthodologique proposée par le responsable technique :
Cette thèse implique les efforts suivants :
- assimilation des domaines techniques : le traitement automatique des
  langues naturelles, l'apprentissage automatique 
- assimilation du domaine d'application : les systèmes de dialogue 
- définition d'un algorithme de fusion de modèles de langage définition
  d'algorithmes de fusion de modèles d'analyse sémantique 
- implanter ces algorithmes (développement informatique)
- développer un template d'application à la fois pour aider à la
  conception de nouvelles applications et en certifier la compatibilité
  (architecture, vulgarisation, propreté du code)
- concevoir et implanter un benchmark 
- tester extensivement et optimiser les algorithmes sur ce jeu de test
  tester les algorithmes optimisés en situation réelle 
- suivre l'intégration de ses algorithmes dans le portail d'applications
  de dialogue expérimental 
- publier ses résultats dans des conférences et des revues
  internationales 

Planning Global du déroulement de la thèse (grandes lignes)

- T0 -> T0+6 : montée en compétence en dialogue, en apprentissage
  automatique et en traitement automatique de la langue naturelle,
  activité qui est maintenue durant toute la thèse
- T0+6 -> T0+12 : conception théorique d'une solution basique au
  problème général de la thèse
- T0+12 -> T0+18 : développement de solutions concurrentes
- T0+18 -> T0+24 : conception d'un benchmark pour les tests et
  l'optimisation des algorithmes
- T0+24 -> T0+30 : intégration dans un portail d'applications de
  dialogue expérimental pour une évaluation grandeur nature des
  algorithmes
- T0+30 -> T0+36 : rédaction du rapport de thèse

-------------------------------------------------------------------------
Message diffuse par la liste Langage Naturel <LN at cines.fr>
Informations, abonnement : http://www.atala.org/article.php3?id_article=48
English version       : 
Archives                 : http://listserv.linguistlist.org/archives/ln.html
                                http://liste.cines.fr/info/ln

La liste LN est parrainee par l'ATALA (Association pour le Traitement
Automatique des Langues)
Information et adhesion  : http://www.atala.org/

ATALA décline toute responsabilité concernant le contenu des
messages diffusés sur la liste LN
-------------------------------------------------------------------------



More information about the Ln mailing list