Sujet de these: Contribution de l'analyse syntaxique a la traduction automatique, Montpellier

Thierry Hamon thierry.hamon at LIPN.UNIV-PARIS13.FR
Tue May 13 10:46:08 UTC 2008


Date: Sun, 11 May 2008 18:56:10 +0200
From: Violaine PRINCE <prince at lirmm.fr>
Message-Id: <1B010FDE-411D-4828-AA6F-5D613C48B288 at lirmm.fr>
X-url: http://www.lirmm.fr/~iss/specdoctinfo/InfoCandidatureAlloc.html


Sujet de thèse rentrée 2008

Contribution de l'analyse syntaxique à la traduction automatique

La traduction automatique a fait d'énormes progrès en ce qui concerne
le transfert lexical (traduction des mots), et la traduction des
expressions figées, grâce à des techniques statistiques lexicales, des
ressources multilingues évoluées et la mise à disposition de corpus
alignés. Aujourd'hui, le nouveau défi consiste à étendre ces
compétences à la construction correcte de phrases en langue cible,
afin de produire des textes grammaticalement acceptables. Plusieurs
techniques sont en concurrence dans ce domaine : générateurs de
structures de surface à partir d'une représentation pivot, ainsi que
diverses méthodes d'apprentissage de formes grammaticales et de
tournures de phrases à partir de corpus.

Le sujet de la thèse proposée consiste en l'étude théorique et
expérimentale de la contribution de l'analyse syntaxique de la langue
source à la génération (allégée) de phrases grammaticalement
correctesen langue cible. Les travaux de l'équipe (Chauché et Prince
2006, Bonnin et Prince 2007, disponibles dans la documentation en
ligne du LIRMM, sur HAL), montrent que la construction syntaxique en
langue cible, si celle-ci n'est pas très éloignée de la langue source
(comme les couples français-anglais, français-espagnol, français-
allemand), peut être réalisée par transformation de la construction
syntaxique des unités en langue source. Parmi les buts du travail
proposé nous pouvons mentionner :

d'étendre, d'améliorer et de réajuster les premières transformations
proposées dans les travaux cités , éventuellement en "apprenant" ces
transformations à partir de données alignées.
A partir du prototype existant SYGFtoE de traduction du français vers
l'anglais, construire une grammaire de transformations. Cette
grammaire doit être le résultat d'un travail théorique et
algorithmique relativement important à partir des structures apprises
en 1.
Evaluer ce travail sur un ou plusieurs corpus.

Candidature : Les candidats devront faire acte de candidature auprès  
de Christophe Dony, sur le lien suivant :
http://www.lirmm.fr/~iss/specdoctinfo/InfoCandidatureAlloc.html 
   avant le 30 mai 2008.

Une formation en TAL est vivement conseillée.

Pour tout renseignement, envoyer un mail à : prince at lirmm.fr



PhD Thesis Subject (Autumn 2008)

  Contribution of Syntactic Analysis to Machine Translation

Machine Translation has tremendously progressed in tasks such as
lexical transfer (word translation), idiomatic expressions, with the
help of statistical lexical techniques, advanced multilingual
resources and the availability of aligned corpora. Nowadays, the new
challenge is to extend these skills to correct sentences building in
the target language, in order to produce grammatically acceptable
texts. Several methods are competing in this field: Surface structure
generators from a pivot representation as well as numerous grammatical
structures and sentence style learning techniques, using corpora.

The subject of this PhD thesis consists in studying, theoretically as
well as experimentally, the source language syntactic analysis
(through parsing) contribution to the generation of grammatically
correct sentences in the target language. Some of our team
contributions (namely Chauché and Prince 2006, Bonnin and Prince 2007,
available at the LIRMM the on-line documentation HAL ), show that the
syntactic generation of the target language, if the latter is not very
far from the source (pairs such as English-German, French-English,
French-Spanish...), might be obtained through the source language
units syntactic structure transformation.

The goals of this work include but are not restricted to:

Extending, enhancing and refurbishing the existing transformation
rules and models suggested in the cited words, possibly through
learning these transformations from aligned data.

Building a transformation grammar, from the existing French to English
translation protoype SYGFtoE. This grammar must result from a
theoretical and algorithmical reworking of the structures learnt in
step 1.

Evaluating this work with corpora.

Application: Candidates must apply at Pr. Dony's following URL :
  http://www.lirmm.fr/~iss/specdoctinfo/InfoCandidatureAlloc.html
  before May, 30th.

A good level in NLP and fluency in French are recommended.

Contact : prince at lirmm.fr



-------------------------------------------------------------------------
Message diffuse par la liste Langage Naturel <LN at cines.fr>
Informations, abonnement : http://www.atala.org/article.php3?id_article=48
English version       : 
Archives                 : http://listserv.linguistlist.org/archives/ln.html
                                http://liste.cines.fr/info/ln

La liste LN est parrainee par l'ATALA (Association pour le Traitement
Automatique des Langues)
Information et adhesion  : http://www.atala.org/
-------------------------------------------------------------------------



More information about the Ln mailing list