Job: Post-doctorat en TALN, Orange

Thierry Hamon thierry.hamon at UNIV-PARIS13.FR
Sun Jun 30 17:27:43 UTC 2013


Date: Thu, 27 Jun 2013 08:22:08 +0000
From: <romain.laroche at orange.com>
Message-ID: <5455_1372321329_51CBF631_5455_2314_1_6A3EA12B995B52459CDFCEFF0835C6B10AF9B1 at PEXCVZYM12.corporate.adroot.infra.ftgroup>

Chers collègues,

Orange propose actuellement un post-doctorat.

Merci de consulter l'offre ci-dessou et, le cas échéant, de postuler
auprès de moi et de laurent.roussarie at orange.com,

Cordialement,

Romain Laroche
ft/nsm/rd/tech/asap/nadia
Ingénieur de recherche sur les systèmes de dialogue
Research engineer on dialogue systems
phone: 01 45 29 62 77
romain.laroche at orange-ftgroup.com

------------------------------------------------------------------------

Méthodes d'analyse sémantique statistique pour l'extraction de
connaissances à partir de corpus semi-annotés

Mots clefs : 
Analyse sémantique, Apprentissage actif, Interaction Homme-Machine,
Dialogue naturel

Contexte :
Le sujet de post-doctorat se rapporte à la problématique de l'analyse
sémantique dans les systèmes dialogue en général. L'analyse sémantique
consiste à transformer un énoncé dans une interprétation (catégorie
sémantique) pour permettre au système de dialogue de poursuivre ses
calculs. L'analyseur sémantique de Disserto s'appuie sur une approche à
base de règles. Le traitement s'effectue en deux étapes : étiqueter les
mots en « tags », puis appliquer les règles sémantiques appropriées aux
tags, de telle manière qu'une combinaison ou association donnée de tags
fournisse une interprétation correcte. Ce principe d'analyse sémantique
à base de règles d'étiquetage et d'association peut être utilisé dans
n'importe quelle langue. 

Cependant, cette méthode est manuelle et nécessite l'intervention d'un
développeur (knowledge engineer). Ce dernier va analyser un corpus de
phrases issues d'interactions de différents utilisateurs avec le service
de dialogue, afin d'élaborer les règles d'analyse sémantiques les plus
pertinentes. Les phrases contenues dans ce type de corpus peuvent être :

- non annotées (par exemple lorsqu'elles sont issues des logs d'un
  service en exploitation)

- annotées manuellement par un opérateur : par exemple dans le cas de
  service mettant en œuvre des fonctions de magicien d'Oz sur la
  reconnaissance vocale (on parle alors de Reconnaissance Vocal Assistée
  par Opérateur) ou sur l'analyse sémantique (illustrée dans
  l'application DissertOz).

Le rôle du post-doctorant sera de développer de nouveaux algorithmes et
de fournir les outils associés qui permettent de faciliter et
d'optimiser le travail du développeur lors de l'élaboration des règles
d'analyse sémantique de Disserto.

------------------------------------------------------------------------

-------------------------------------------------------------------------
Message diffuse par la liste Langage Naturel <LN at cines.fr>
Informations, abonnement : http://www.atala.org/article.php3?id_article=48
English version       : 
Archives                 : http://listserv.linguistlist.org/archives/ln.html
                                http://liste.cines.fr/info/ln

La liste LN est parrainee par l'ATALA (Association pour le Traitement
Automatique des Langues)
Information et adhesion  : http://www.atala.org/
-------------------------------------------------------------------------



More information about the Ln mailing list