Sujet de these: Amelioration de la qualite de traduction (CIFRE)

Thierry Hamon thierry.hamon at LIPN.UNIV-PARIS13.FR
Mon Sep 26 07:30:03 UTC 2005


Date: Fri, 23 Sep 2005 16:05:21 +0200
From: Denis Maurel <denis.maurel at univ-tours.fr>
Message-Id: <6.2.0.14.0.20050923160204.01cb39b0 at rabelais.univ-tours.fr>
X-url: http://tln.li.univ-tours.fr/
X-url: http://www.li.univ-tours.fr/
X-url: http://www.systran.fr/index.html
X-url: http://www.anrt.asso.fr/fr/espace_cifre/accueil.jsp


1. Titre

Amelioration de la qualite de traduction des noms
propres. Modulations, translitterations, paraphrases, anaphores.

Mots-clefs :
Traitement automatique des langues, Noms propres, Traduction
automatique, TAO, Anaphores, Translitteration.


2. Introduction du sujet

Ce sujet de these s'inscrit dans le cadre du projet Prolex de
traitement automatique des noms propres, projet du Laboratoire
d'Informatique (LI) de l'Universite Francois-Rabelais de Tours. Il
sera realise en partenariat avec la societe Systran SA, dans le cadre
d'une bourse Cifre.


Voir les URL :
http://tln.li.univ-tours.fr/
http://www.li.univ-tours.fr/
http://www.systran.fr/index.html
http://www.anrt.asso.fr/fr/espace_cifre/accueil.jsp

Nous souhaitons appliquer une partie des resultats obtenus suite au
projet Technolangue-NomsPropres (formalisation d'une ontologie
multilingue des noms propres, creation d'un dictionnaire relationnel
multilingue de noms propres, reconnaissance automatique des noms
propres d'un texte, etc.) à la problematique de la traduction des noms
propres.


3. Quelques problematiques a aborder

Contrairement aux idées reçues, la traduction automatique des noms
propres est loin d'être évidente. Elle constitue pourtant une étape
essentielle dans la mise en oeuvre d'une traduction de qualité. Voici
quelques exemples que nous comptons aborder au cours de ce doctorat et
qui montreront l'importance de cette problématique


Exonymes : Une idee fausse, et pourtant tres repandue, est celle de la
non-traduction des noms propres. Donnons tout de suite deux
contre-exemples : lorsqu'il existe un exonyme (c'est-a-dire un mot de
la langue cible pour designer un toponyme de la langue source), comme
London qui va se "traduire" Londres, ou Pas de Calais qui se "traduit"
Strasse von Dover en allemand et Straits of Dover en anglais.


Modulations : Les points de vue sur un evenement sont souvent
differents d'une langue a une autre. Par exemple, la défaite de
Sadowa en francais est la victoire de Koniggratz (Sieg bei Koniggratz)
en allemand et une bataille dans les autres langues (Battle of Sadowa
ou Battle of Koniggratz en anglais, bitwa pod Sadowa en polonais,
etc.).


Translitterations : D'une langue europeenne a une autre, les regles
courantes de translitterations des alphabets non latins differents.
Par exemple, Tchekhov, en francais, sera "traduit" par Tschechow en
allemand, Chekhov en anglais, Chejov en espagnol, etc.


Paraphrases : Dans certains cas, suivant la langue cible et
l'eloignement de l'utilisateur par rapport au pays de la langue
source, il faudra envisage d'integrer de la paraphrase ou du
remplacement. Par exemple : "L'Elysee et Matignon se sont mis
d'accord". Est-il notoire a l'etranger que ces batiments abritent
la presidence et le gouvernement francais? Ou encore : "Rennes a
rencontre Lille hier. Les Bretons ont battu les Nordistes.". La
traduction de "Nordistes" n'est peut-etre pas judicieuse pour un
etranger qui n'est pas cense savoir que Lille est dans la region Nord
de la France...


Anaphores : les noms de pays en francais peuvent etre masculin ou
feminin, alors qu'ils sont en general neutres en allemand. La
resolution des anaphores pronominales permet de prendre en compte
cette difference. D'autres reprises anaphoriques ou par descriptions
definies peuvent necessiter une paraphrase.


Etc.

4. Profil du candidat

Titulaire d'un master de recherche (ou d'un DEA, ou equivalent) en
informatique, avec une certaine connaissance du tal (oriente
linguistique). Et une parfaite maitrise de l'anglais (souvent
utilise comme langue interne a l'entreprise Systran). Une ouverture
sur le monde de l'entreprise est necessaire, ainsi, certainement,
qu'un interet pour la traduction.


5. Encadrement

Universite Francois-Rabelais de Tours:
Professeurs Denis Maurel et Jean-Yves Antoine.
Systran:
Jean Senellart, Directeur R&D

Contact : denis.maurel at univ-tours.fr.

6. Financement

Contrat Cifre entre l'Universite Francois-Rabelais et l'entreprise Systran.

7. Recrutement

Un contrat Cifre est a la fois un recrutement universitaire (le
candidat devra etre accepte par l'Universite Francois-Rabelais et par
le LI) et une embauche par l'entreprise (le candidat devra passer avec
succes les différents niveaux d'entretien habituels pour toute
embauche chez Systran).



Denis Maurel


____________________________________
Professeur Denis Maurel
Universite Francois-Rabelais de Tours
LI (Laboratoire d'Informatique)
EPU-DI
64 avenue Jean-Portalis
37200 Tours
France
Tel. (33) 2.47.36.14.35
Telc. (33) 2.47.36.14.22
mailto:denis.maurel at univ-tours.fr
http://www.li.univ-tours.fr
http://tln.li.univ-tours.fr/
-------------------------------------------------------------------------
Message diffusé par la liste Langage Naturel <LN at cines.fr>
Informations, abonnement : http://www.biomath.jussieu.fr/LN/LN-F/
English version          : http://www.biomath.jussieu.fr/LN/LN/
Archives                 : http://listserv.linguistlist.org/archives/ln.html

La liste LN est parrainée par l'ATALA (Association pour le Traitement
Automatique des Langues)
Information et adhésion  : http://www.atala.org/
-------------------------------------------------------------------------



More information about the Ln mailing list