These: Hong-Thai NGUYEN, Des systemes de TA homogenes aux systemes de TAO heterogenes

Thierry Hamon thierry.hamon at UNIV-PARIS13.FR
Wed Dec 16 11:48:19 UTC 2009


Date: Mon, 14 Dec 2009 10:28:48 +0100
From: NGUYEN Hong-Thai <Hong-Thai.Nguyen at imag.fr>
Message-Id: <CCAE073E-7E71-41C5-B4E6-1361FBFFEC3F at imag.fr>
X-url: http://www-clips.imag.fr/geta/User/hong-thai.nguyen/Welcome.html

Bonjour,


J'ai le plaisir de vous inviter à ma soutenance de thèse, intitulée  
"Des systèmes de TA homogènes aux systèmes de TAO hétérogènes" et  
préparée au sein de l'équipe GETALP du Laboratoire d'Informatique de  
Grenoble (LIG)

La soutenance aura lieu le 18 décembre 2009 à 14h00 dans  
l'amphithéâtre de la Maison Jean Kuntzmann, 110 av. de la Chimie,  
Domaine Universitaire de Saint-Martin-d'Hères.

Vous êtes également invité au pot qui suivra.

========================================================================
Le jury sera composé de:

M.      Laurent BESACIER      Président         UJF
M.      Jacques CHAUCHÉ       Rapporteur        Univ. Montpellier
M.      Denis MAUREL          Rapporteur        Univ. Tours
M.      Jesus CARDEÑOSA       Rapporteur        Univ. Madrid (UPM)
M.      Vincent BERMENT       Examinateur       C&S et CC INaLCO (Paris)
M.      Mathieu LAFOURCADE    Examinateur       Univ. Montpellier
M.      Éric CASTELLI         Codirecteur       MICA, CNRS
M.      Christian BOITET      Directeur         UJF
= 
= 
========================================================================
Titre :  Des systèmes de TA homogènes vers des systèmes de TAO  
hétérogènes
Auteur : Hong-Thai NGUYEN
Résumé :
La thèse porte sur les problèmes posés par la conception et la  
réalisation de la partie logicielle des systèmes de traduction  
automatisée (TAO) hétérogènes, intégrant des systèmes de TA  
multiples et/ou à composants hétérogènes, ainsi qu'une partie THAM  
(traduction humaine aidée par la machine), reposant sur des mémoires  
de traductions. Ces systèmes se développent à côté des systèmes  
de TA homogènes et de THAM, et les supplanteront peut-être à moyen  
terme.

Leurs différents composants de TA seront construits par des équipes  
différentes, distribuées autour de la planète, avec des méthodes  
algorithmiques et des outils différents (langages spécialisés ou  
LSPL), ainsi que des ressources et composants linguiciels différents  
(dictionnaires et corpus de divers types, grammaires et transducteurs  
basés sur des règles), à l'aide d'EDL (environnements de  
développement linguiciel) eux aussi différents. Les contributions de  
la thèse concernent en particulier :
l'amélioration des « méta-EDL de TAO », permettant d'effectuer une  
transition incrémentale entre les EDL natifs des systèmes de TA  
utilisés pour construire un systèmes de TAO à composants  
hétérogènes, et un futur EDL intégrateur universel, dans lequel on  
pourra « rapatrier » la compilation et l'exécution des LSPL ;
la conception et la réalisation d'une base lexicale partageant un  
même pivot lexical, PIVAX, réalisée au-dessus de la plate-forme  
Jibiki (G. Sérasset, GETALP) ;
la réingénierie de langages spécialisés « externes » (non  
supportés par l'EDL Ariane-G5), avec application aux « systèmes-Q  
» (A. Colmerauer, 1967), qui servit de base pendant 15 ans au système  
de TA TAUM-météo destiné aux bulletins météorologiques canadiens ;
la conception et la réalisation d'un « moniteur » adapté à la  
partie « production » d'un système de TAO hétérogène, EMEU_w.1.0,  
qui a été développé et utilisé dans le cadre d'un projet de grande  
ampleur.

Mots-clés : TA et TAO hétérogène, BDLM, réingénierie de LSPL, EDL.


========================================================================
Abstract:

The thesis deals with problems posed by the design andimplementation  
of the software part of CAT (Computer Automated Translation) systems,  
integrating multiple MT (Machine Translation) systems and/or MT  
systems with heterogeneous components, as well as a MAHT (Machine  
Aided Human Translation) part, based on translation memories. These  
systems are emerging beside homogeneous MT systems and MAHT system,  
and may replace them in the middle term.

Their various MT components will be built by different teams,  
distributed around the world, using different algorithmic methods and  
different tools (Specialized Languages or SLLP), as well as different  
lingware resoures and components (corpora and dictionaries of various  
types, rule-based grammars and transducers), and developing under  
different lingware development environments (EDL). The contributions  
of the thesis concern especially:

the improvement of the "meta-EDL for CAT systems", allowing to carry  
out an incremental transition between the native EDLs of the MT  
systems used for building a heterogeneous MT system, and a future  
"universal integrating EDL", in which it will be possible to  
reengineer the compilers and engines (interpreters) of the SLLPs from  
various systems;
the design and the implementation of PIVAX, a contributive lexical  
database for heterogeneous CAT systems sharing the same "lexical  
pivot", built over the Jibiki platform (G.Sérasset, GETALP);
the reengineering of "external" specialized languages (not supported  
by the EDL of Ariane-G5), with an application to the "Q-Systems" (A.  
Colmerauer, 1967) that was for 15 years the basis of the TAUM-meteo MT  
system used to translate the Canadian weather bulletins ;
the design and the implementation of EMEU_w.1.0, a "monitor"  handling  
the "production" part of a heterogeneous CAT system, that has been  
used in the framework of a large-scale project
Keywords: heterogeneous CAT, MT, lexical database, SLLP reengineering,  
EDL (environment for lingware development).

========================================================================

Cordialement,

============================
Hong-Thai NGUYEN
Email: Hong-Thai.Nguyen at imag.fr
GETALP-LIG
385 rue de la Biblioth∂e`que BP 53
38041 Grenoble cedex
France
Tel.:   + 33 4 7651 4817
Fax.:  + 33 4 7663 5686
GSM.: + 33 6 27 04 86 22
IM (Yahoo): thaichat04, (Skype): thaichat04
Page: http://www-clips.imag.fr/geta/User/hong-thai.nguyen/Welcome.html

-------------------------------------------------------------------------
Message diffuse par la liste Langage Naturel <LN at cines.fr>
Informations, abonnement : http://www.atala.org/article.php3?id_article=48
English version       : 
Archives                 : http://listserv.linguistlist.org/archives/ln.html
                                http://liste.cines.fr/info/ln

La liste LN est parrainee par l'ATALA (Association pour le Traitement
Automatique des Langues)
Information et adhesion  : http://www.atala.org/
-------------------------------------------------------------------------



More information about the Ln mailing list