Sujet de these: Generation d'enonces en langues naturelles, France Telecom R&D, Lannion

Thierry Hamon thierry.hamon at LIPN.UNIV-PARIS13.FR
Wed Jul 13 16:23:31 UTC 2005


Date: Wed, 13 Jul 2005 12:46:01 +0200
From: "PANAGET Franck RD-TECH-LAN" <franck.panaget at francetelecom.com>
Message-ID: <91C9D6383F86214599DA96C5EDFBCE3B024246F8 at ftrdmel1.rd.francetelecom.fr>
X-url: http://www.rd.francetelecom.com/fr/galerie/dialogue_intelligent/index.php
X-url: http://www.rd.francetelecom.com/fr/technologies/ddm200210/dossier.php
X-url: http://perso.rd.francetelecom.fr/panaget

 
 
 
Titre :
Génération d'énoncés en langues naturelles dans un contexte
d'applications de dialogue personne-machine

 

Mots clefs : 
Génération d'énoncés en langue naturelle, dialogue naturel
personne-machine, agent rationnel intelligent, traitement automatique
des langues naturelles

 

Sujet :
Le sujet de thèse proposé s'inscrit dans le domaine de la conception
de systèmes de dialogue naturel «intelligents»
(http://www.rd.francetelecom.com/fr/galerie/dialogue_intelligent/index.php).
L'approche développée à France Télécom Recherche & Développement est
fondée sur une modélisation des principes primitifs qui régissent le
comportement rationnel et traite ainsi le fait de communiquer comme
une action à part entière, que l'on appelle acte communicatif
(http://www.rd.francetelecom.com/fr/technologies/ddm200210/dossier.php).
Elle vise notamment la conception de systèmes paramétrables selon
l'application à laquelle ils sont destinés.

 
La technologie d'agent dialoguant développé à France Télécom Recherche
& Développement s'appelle Artimis. Son noyau, fondé sur cette
approche, opère sur une représentation logique des connaissances. Son
exploitation réelle est alors conditionnée par l'existence de
mécanismes permettant de construire à partir d'un message  de
l'utilisateur une forme logique des actes communicatifs qu'il véhicule
et, inversement, à partir d'une forme logique des actes de dialogue le
message du système qui la réalise. Ces deux conditions sont
satisfaites par l'utilisation de ce que l'on appelle respectivement
des composants d'interprétation et de génération. 

 
Le générateur respecte le schéma fonctionnel classique à trois
composants ([Levelt 1989]) : un macro-planificateur, un
micro-planificateur et un formulateur. Le macro-planificateur gère la
structure organisationnelle du message à générer en transformant les
séquences d'actes communicatifs produites en des expressions de
sémantique idéationnelle (~ sémantique lexicale). Il identifie aussi
les relations rhétoriques permettant d'accroître la cohérence du
message et le simplifie en appliquant des règles d'agrégation. Le
micro-planificateur sélectionne le meilleur ensemble de ressources
linguistiques (lexicales et grammaticales)  verbalisant le message à
communiquer. Finalement, le formulateur utilise une grammaire d'arbres
adjoints [Joshi 1987] pour ordonner les éléments de l'énoncé, les
accorder et appliquer un traitement morphologique. Le générateur
actuel permet de produire des énoncésd en Français, Anglais, Allemand,
Espagnol et Russe.

 
L'objectif de cette thèse est de concevoir un mécanisme de
macro-planification et de micro-planification qui s'adapte au contexte
de dialogue (historique du dialogue) et à l'utilisateur ("profil
linguistique") afin d'accroître le naturel des énoncés générés. Ce
mécanisme devra améliorer la structuration rhétorique et l'agrégation
des messages générés ainsi que la production d'énoncés elliptiques et
anaphoriques (voir déictiques dans le cadre d'applications
multimodales). La solution proposée devra être validée dans un
contexte d'applications multilingues.

 
Dans une première étape d'environ 18 mois, le candidat étudiera de
façon pratique les générateurs d'énoncés en général et celui de France
Télécom R&D en particulier tout en se familiarisant avec le contexte
de dialogue personne-machine. Le candidat devra proposer et mettre
enoeuvre une première version d'un mécanisme de macro et
micro-planification, visant à être compatible avec le cadre théorique
et pratique développé à France Télécom R&D. Durant cette étape, le
candidat pourra éventuellement étudier des corpara de dialogues
personne-machine obtenus avec des applications vocales, écrites ou
multimodales développées sur la base de la technologie Artimis afin
d'identifier de situations dans lesquelles les énoncés générés
manquent de naturel.

 
Dans une seconde étape, le candidat s'intéressera à une généralisation
et à une formalisation du mécanisme proposé, dont la généricité et
l'efficacité devront être validées par une mise en oeuvre dans au
moins deux contextes applicatifs de systèmes opérationnels de dialogue
multilingue Homme-machine. Les applications retenues devront reposer
sur l'exploitation des réseaux télécom (fixe, mobile et/ou internet)
et pourront éventuellement utiliser des agents conversationnels animés
(Embodied Conversational Agents).

 

Nature du financement : 
CDD de 36 mois financé par France Télécom.
 
Localisation :
France Télécom R&D à Lannion (Côtes d'Armor).
 
Pour tous renseignements, contacter :
Franck Panaget
France Télécom Recherche & Développement
EASY / ADN
2, avenue Pierre Marzin
22307 Lannion Cedex
 
Tél  : 02 96 05 28 52   Email : franck.panaget at francetelecom.com
Mobile : 06 08 52 21 34  Web : http://perso.rd.francetelecom.fr/panaget

 

______________________________________________________
& france telecom Recherche & Développement / TECH / EASY / ADN
Technopole Anticipa - 22307 Lannion cedex - France
http://perso.rd.francetelecom.fr/panaget
Tél: 02.96.05.28.52 - Mobile: 06 08 52 21 34 - Télécopie: 02 96 05 32 86
_______________________________________________________________


-------------------------------------------------------------------------
Message diffusé par la liste Langage Naturel <LN at cines.fr>
Informations, abonnement : http://www.biomath.jussieu.fr/LN/LN-F/
English version          : http://www.biomath.jussieu.fr/LN/LN/
Archives                 : http://listserv.linguistlist.org/archives/ln.html

La liste LN est parrainée par l'ATALA (Association pour le Traitement
Automatique des Langues)
Information et adhésion  : http://www.atala.org/
-------------------------------------------------------------------------



More information about the Ln mailing list