These: Sylvain Raybaud, Utilisation de mesures de confiance en traduction automatique

Thierry Hamon thierry.hamon at UNIV-PARIS13.FR
Wed Dec 5 08:53:41 UTC 2012


Date: Mon, 03 Dec 2012 14:42:56 +0100
From: Sylvain Raybaud <sylvain.raybaud at loria.fr>
Message-ID: <50BCAC60.4040708 at loria.fr>

Bonjour

  Je souhaite vous faire part à fin de diffusion sur ln at cines.fr, si
vous êtes d'accord, de la soutenance prochaine (mercredi 5 décembre à
14h au LORIA à Nancy) de ma thèse intitulée :

« De l'utilisation de mesures de confiance en traduction automatique :
évaluation, post-édition et application à la traduction de la parole. »

Cette thèse sera soutenue devant le jury suivant : MM. François Yvon et
Laurent Besacier, rapporteurs ; MM. Guillaume Gravier et François
Charpillet, examinateurs ; ainsi M. Kamel Smaïli, directeur de thèse, et
M. David Langlois, coencadrant.

Les résumés en français et en anglais suivent.

bien cordialement,

Sylvain Raybaud

Résumé :

Cette thèse de doctorat aborde les problématiques de l'estimation de
confiance pour la traduction automatique, et de la traduction
automatique statistique de la parole spontanée à grand vocabulaire. J'y
propose une formalisation du problème d'estimation de confiance, et
aborde expérimentalement le problème sous le paradigme de la
classification et régression multivariée. Je propose une évaluation des
performances des différentes méthodes évoquées, présente les résultats
obtenus lors d'une campagne d'évaluation internationale et propose une
application à la post-édition par des experts de documents traduits
automatiquement. J'aborde ensuite le problème de la traduction
automatique de la parole. Après avoir passé en revue les spécificités du
médium oral et les défis particuliers qu'il soulève, je propose des
méthodes originales pour y répondre, utilisant notamment les réseaux de
confusion phonétiques, les mesures de confiances et des techniques de
segmentation de la parole. Je montre finalement que le prototype proposé
rivalise avec des systèmes état de l'art à la conception plus classique.

Abstract :

In this thesis I shall deal with the issues of confidence estimation for
machine translation and statistical machine translation of large
vocabulary spontaneous speech translation. I shall first formalize the
problem of confidence estimation. I present experiments under the
paradigm of multivariate classification and regression. I review the
performances yielded by different techniques, present the results
obtained during the WMT2012 internation evaluation campaign and give the
details of an application to post edition of automatically translated
documents. I then deal with the issue of speech translation. After going
into the details of what makes it a very specific and particularly
challenging problem, I present original methods to partially solve it,
by using phonetic confusion networs, confidence estimation techniques
and speech segmentation. I show that the prototype I developped yields
performances comparable to state-of-the-art of more standard design.

-------------------------------------------------------------------------
Message diffuse par la liste Langage Naturel <LN at cines.fr>
Informations, abonnement : http://www.atala.org/article.php3?id_article=48
English version       : 
Archives                 : http://listserv.linguistlist.org/archives/ln.html
                                http://liste.cines.fr/info/ln

La liste LN est parrainee par l'ATALA (Association pour le Traitement
Automatique des Langues)
Information et adhesion  : http://www.atala.org/
-------------------------------------------------------------------------



More information about the Ln mailing list