These: Estelle Delpech, Traduction assistee par ordinateur et corpus comparables

Thierry Hamon thierry.hamon at UNIV-PARIS13.FR
Wed Jun 26 10:45:00 UTC 2013


Date: Mon, 24 Jun 2013 23:10:13 +0200 (CEST)
From: "Estelle DELPECH" <estelle.delpech at univ-nantes.fr>
Message-ID: <5b7a3b6870e73c2108fdb4db6792c01c.squirrel at webmail.univ-nantes.fr>


Bonjour,

J'ai le plaisir de vous inviter à la soutenance de mon travail de thèse
réalisé au sein du Laboratoire d'Informatique de Nantes Atlantique
(LINA) et intitulé :

"Traduction assistée par ordinateur et corpus comparables -
contributions à la traduction compositionnelle".

La soutenance aura lieu le mardi 2 juillet 2013 à 14h00 dans la salle 3
du LINA. Vous êtes également convié-e-s au pot de thèse qui suivra.

Bien cordialement,
Estelle Delpech

-----
Composition du jury :

- Nabil Hathout, Directeur de recherches, CNRS (Examinateur)
- Élisabeth Lavault-Olléan, Professeure, Université Stendhal Grenoble 3
  (Rapporteur)
- Michel Simard, Senior Research Officer, Centre National de Recherche
  du Canada (Rapporteur)
- Béatrice Daille, Professeure, Université de Nantes (Directrice de
  thèse)
- Emmanuel Morin, Professeur, Université de Nantes (Co-directeur de
  thèse)
- Emmanuel Planas, Maître de conférences, Université Catholique de
  l’Ouest (Invité)

-----
Résumé :

Notre travail concerne l’extraction de lexiques bilingues à partir de
corpus comparables, avec une application à la traduction
spécialisée. Nous avons d’abord évalué les méthodes classiques
d’acquisition de lexiques en corpus comparables (basées sur l’hypothèse
distributionnelle : plus deux termes apparaissent dans des contextes
similaires, plus il y a de chances qu’ils soient des traductions) d’un
point de vue applicatif. L’évaluation a montré que les traducteurs sont
mal à l’aise avec les lexiques extraits : la traduction correcte est
trop souvent noyée dans une liste de traductions candidates et ils
préféreraient utiliser un lexique plus petit mais plus précis. Partant
de ce constat, nous nous sommes orientés vers une autre approche qui a
fait récemment ses preuves pour l’exploitation des corpus comparables et
produit des lexiques plus adaptés aux besoins des traducteurs : la
traduction compositionnelle (la traduction du terme source est fonction
de la traduction de ses parties). Nous nous sommes concentrés sur la
traduction d’unités monolexicales : le terme source est découpé en
morphèmes, les morphèmes sont traduits puis recomposés en un terme
cible. Dans ce cadre, nous avons poursuivi trois axes de recherche : la
génération de traductions fertiles (cas où le terme cible contient plus
de mots lexicaux que le terme source), l’indépendance aux structures
morphologiques et l’ordonnancement des traductions candidates.
Mots-clés : traduction assistée par ordinateur, corpus comparables,
compositionnalité, learning-to-rank, évaluation centrée utilisateur,
morphologie computationnelle.

-----
Abstract:

Our work deals with the extraction of bilingual lexicons from comparable
corpora with an application to specialized translation. We started by
evaluating classical methods based on the distributional hypothesis (the
more two terms appear in similar contexts, the more likely they are
translations of each other) in a user-oriented fashion.  This evaluation
raised the fact that translators feel very uncomfortable with this kind
of lexicon: they feel correct translations are uneasy to spot in the
lists of candidate translations and would rather use a smaller lexicon
but with higher precision rates. Based on this observation, we turned to
another approach for term translation which has been recently and
successfully experimented on comparable corpora and produce lexicons
that meet the demands of the translators: compositional translation. In
this framework, the translation of a term is composed of the translation
of its parts.  We concentrated on the translation of monolexical terms:
the source term is decomposed into morphemes, morphemes are translated
into the target language and recomposed as a target term. We
investigated three lines of research: generation of fertile translations
(cases in which the target term has more lexical words than the source
term), independence to morphological structure and candidate translation
ranking.  Keywords : computer-aided translation, comparable corpora,
compositionality, learningto- rank, user-centered evaluation,
computational morphology

-------------------------------------------------------------------------
Message diffuse par la liste Langage Naturel <LN at cines.fr>
Informations, abonnement : http://www.atala.org/article.php3?id_article=48
English version       : 
Archives                 : http://listserv.linguistlist.org/archives/ln.html
                                http://liste.cines.fr/info/ln

La liste LN est parrainee par l'ATALA (Association pour le Traitement
Automatique des Langues)
Information et adhesion  : http://www.atala.org/
-------------------------------------------------------------------------



More information about the Ln mailing list