Job: Postdoctoral position at France Telecom R&D

Thierry Hamon thierry.hamon at LIPN.UNIV-PARIS13.FR
Tue Mar 21 08:28:57 UTC 2006


Date: Mon, 20 Mar 2006 18:28:33 +0100
From: "MAMI Yassine RD-TECH-LAN" <yassine.mami at francetelecom.com>
Message-ID: <B30D6148F304A743A53B9B44751CDB9A03E6EC73 at FTRDMEL2.rd.francetelecom.fr>


Merci de diffuser le plus largement possible aux personnes
potentiellement intéressées.


------------------------------------------------------------------------

Subject:

Study of the combination of statistical and linguistic approaches in
spoken machine translation

Description:

This post-doctoral position relates to the machine translation by
combined methods and its integration in spontaneous speech recognition
system. Its main goal is to study the combination of statistical and
linguistic approaches in order to take advantage of each of them. 

The research work will proceed in two parts. The first part will
consist in applying statistical translation methods to the application
context and in validating the method robustness on spontaneous
speech. A coupling of statistical methods with the speech recognition
(using word graphs or confusion networks, taking into account
confidence measures) will also be studied. 

In the second part, the candidate will focus on the combination of the
two approaches. On the one hand, an a posteriori combination of
statistical and linguistic approaches will be studied by choosing the
best solution among several assumptions of translation according to a
criterion to be defined (definition of compatible and comparable
scores at exit of the two approaches). 

On the other hand, an a priori combination of the approaches will also
be considered by defining a priori some criteria which allow to
determine whether sentences are adapted more to the statistical
approach or to the linguistic approach. 

Finally, in order to integrate the two approaches, their assumptions
will be merged within the same sentence (using the chunk concept and
the choice of the best translation by chunk).


Prospective candidates should be PhD graduated in statistical methods,
speech recognition or automatic machine translation.


This post-doctoral is a 12 months position, extensible to 18 months.

Interested candidates are invited to contact Yassine MAMI.
yassine.mami at francetelecom.com
Tel. +33 2 96 05 27 11
France Télécom / Division R&D
2 avenue Pierre Marzin 
22307 Lannion 
France


------------------------------------------------------------------------------------------------------
Sujet :

Etude de la combinaison des approches statistiques et linguistiques en
traduction automatique de la parole


Description :

Ce post-doc s'inscrit dans le domaine de la traduction automatique par
des méthodes combinées et son intégration à la reconnaissance de la
parole spontanée. L'objet principal sera d'étudier la combinaison des
approches statistique et linguistique afin de tirer parti au mieux des
avantages de chacune d'elles.

Le travail se déroulera en deux parties. La première consistera à
appliquer les méthodes de traduction statistique au contexte
applicatif et à valider la robustesse à la parole spontanée. Il s'agit
également d'étudier le couplage de méthodes statistiques avec la
reconnaissance de la parole (utilisation directe sur des graphes de
mots ou sur des confusion networks, prise en compte des mesures de
confiance).

Dans la deuxième partie, on étudiera la combinaison des deux
approches. Il s'agit de combiner a posteriori l'approche statistique
et linguistique, en choisissant la meilleure solution parmi plusieurs
hypothèses de traduction selon un critère à définir (définition de
scores compatibles et comparables en sortie des deux approches).

On étudiera également la combinaison a priori, en recherchant des
critères a priori sur les énoncés permettant de déterminer s'ils sont
plus appropriés pour l'une ou l'autre des approches. Enfin, dans
l'optique d'intégration des deux approches, on fusionnera les
hypothèses des deux approches au sein d'un même énoncé (utilisation de
la notion de chunk et choix de la meilleure traduction par chunk).


Le candidat doit être titulaire d'un doctorat en méthodes
statistiques, reconnaissance de parole ou traduction automatique.


La durée du post-doc est de 12 mois extensible à 18 mois.

Vous êtes invités à contacter Yassine MAMI
yassine.mami at francetelecom.com
Tel. +33 2 96 05 27 11
France Télécom / Division R&D
2 avenue Pierre Marzin 
22307 Lannion 
France


-------------------------------------------------------------------------
Message diffusé par la liste Langage Naturel <LN at cines.fr>
Informations, abonnement : http://www.atala.org/article.php3?id_article=48
English version          : 
Archives                 : http://listes.cines.fr/wws/arc/ln
                           http://listserv.linguistlist.org/archives/ln.html

La liste LN est parrainée par l'ATALA (Association pour le Traitement
Automatique des Langues)
Information et adhésion  : http://www.atala.org/
-------------------------------------------------------------------------



More information about the Ln mailing list