These: Raphael Rubino, Traduction automatique statistique et adaptation a un domaine specialise
Thierry Hamon
thierry.hamon at UNIV-PARIS13.FR
Wed Nov 23 08:43:04 UTC 2011
Date: Mon, 21 Nov 2011 16:35:16 +0100
From: Raphaël Rubino <raphael.rubino at gmail.com>
Message-ID: <CACmsymnDCm6ypGfwPoy0ahTg0GHU5R+nxjg+1Kfe0q8VP4Jb3g at mail.gmail.com>
Bonjour,
J'ai le plaisir de vous convier à ma soutenance de thèse de doctorat en
informatique, qui aura lieu le mercredi 30 novembre 2011 à 14h30 dans
l'amphi Blaise Pascal du CERI, Université d'Avignon et des Pays de
Vaucluse, campus Agroparc. Vous êtes également cordialement invités au
pot de thèse qui suivra la soutenance et qui aura lieu dans la salle de
réunion du laboratoire informatique d'Avignon.
Titre de la thèse : Traduction automatique statistique et adaptation à
un domaine spécialisé
Résumé :
La traduction automatique statistique se base sur des ensembles de
textes afin de construire un modèle de traduction. Traduire des textes
n'ayant pas été observés au préalable s'avère difficile et mène à des
performances en terme de qualité de traduction souvent peu
satisfaisantes. Cet aspect est amplifié par la diversité des domaines de
spécialité, ne permettant pas de disposer d'une quantité de données
suffisante pour construire des systèmes de traduction efficaces.
Dans cette thèse, nous proposons d'adapter des systèmes de traduction
automatique aux domaines de spécialité. Deux principaux axes sont
étudiés : l'édition a posteriori d'hypothèses de traduction issues de
systèmes automatiques et l'acquisition de lexiques bilingues
spécialisés. L'originalité de nos travaux en post-édition réside dans
la combinaison d'approches basées sur l'alignement sous-phrastique et ne
nécessitant pas l'intervention humaine dans les processus de traduction
et de post-édition. Nos approches pour l'extraction de lexiques se
différencie des précédentes par la prise en considération de plusieurs
niveaux de représentation des termes, que ce soit syntaxique, sémantique
ou pragmatique.
Nous évaluons l'efficacité des approches proposées dans un contexte
spécialisé : le domaine médical. Nous comparons nos résultats aux
travaux précédents concernant cette tâche. Pour la post-édition, nous
mettons en avant la pertinence de notre approche malgré le peu de
données spécialisées utilisées et le faible coût de sa mise en
place. Pour l'acquisition de lexiques, nous montrons l'intérêt du niveau
sémantique dans la représentation des termes et la nécessité de combiner
différentes vues correspondant à des aspects linguistiques particuliers.
De manière générale, nous avons amélioré la qualité de traductions
issues de systèmes automatiques pour le domaine médical. Finalement, la
combinaison des méthodes proposées pour chaque tâche est possible et
donne lieu à des perspectives intéressantes.
Jury :
M. Hervé Blanchon, Maître de Conférences, LIG, Grenoble (Rapporteur)
M. Kamel Smaïli, Professeur des Universités, LORIA, Nancy (Rapporteur)
M. Laurent Besacier, Professeur des Universités, LIG, Grenoble (Examinateur)
M. Jean Senellart, Directeur Scientifique, Systran, Paris (Examinateur)
M. Philippe Langlais, Professeur Agrégé, RALI, Montréal (Co-directeur)
M. Fabrice Lefèvre, Professeur des Universités, LIA, Avignon (Co-directeur)
M. Georges Linarès, Professeur des Universités, LIA, Avignon (Directeur)
Raphaël Rubino
-------------------------------------------------------------------------
Message diffuse par la liste Langage Naturel <LN at cines.fr>
Informations, abonnement : http://www.atala.org/article.php3?id_article=48
English version :
Archives : http://listserv.linguistlist.org/archives/ln.html
http://liste.cines.fr/info/ln
La liste LN est parrainee par l'ATALA (Association pour le Traitement
Automatique des Langues)
Information et adhesion : http://www.atala.org/
-------------------------------------------------------------------------
More information about the Ln
mailing list