These: Hong-Thai NGUYEN, Des systemes de TA homogenes aux systemes de TAO heterogenes
Thierry Hamon
thierry.hamon at UNIV-PARIS13.FR
Wed Dec 16 11:48:19 UTC 2009
Date: Mon, 14 Dec 2009 10:28:48 +0100
From: NGUYEN Hong-Thai <Hong-Thai.Nguyen at imag.fr>
Message-Id: <CCAE073E-7E71-41C5-B4E6-1361FBFFEC3F at imag.fr>
X-url: http://www-clips.imag.fr/geta/User/hong-thai.nguyen/Welcome.html
Bonjour,
J'ai le plaisir de vous inviter à ma soutenance de thèse, intitulée
"Des systèmes de TA homogènes aux systèmes de TAO hétérogènes" et
préparée au sein de l'équipe GETALP du Laboratoire d'Informatique de
Grenoble (LIG)
La soutenance aura lieu le 18 décembre 2009 à 14h00 dans
l'amphithéâtre de la Maison Jean Kuntzmann, 110 av. de la Chimie,
Domaine Universitaire de Saint-Martin-d'Hères.
Vous êtes également invité au pot qui suivra.
========================================================================
Le jury sera composé de:
M. Laurent BESACIER Président UJF
M. Jacques CHAUCHÉ Rapporteur Univ. Montpellier
M. Denis MAUREL Rapporteur Univ. Tours
M. Jesus CARDEÑOSA Rapporteur Univ. Madrid (UPM)
M. Vincent BERMENT Examinateur C&S et CC INaLCO (Paris)
M. Mathieu LAFOURCADE Examinateur Univ. Montpellier
M. Éric CASTELLI Codirecteur MICA, CNRS
M. Christian BOITET Directeur UJF
=
=
========================================================================
Titre : Des systèmes de TA homogènes vers des systèmes de TAO
hétérogènes
Auteur : Hong-Thai NGUYEN
Résumé :
La thèse porte sur les problèmes posés par la conception et la
réalisation de la partie logicielle des systèmes de traduction
automatisée (TAO) hétérogènes, intégrant des systèmes de TA
multiples et/ou à composants hétérogènes, ainsi qu'une partie THAM
(traduction humaine aidée par la machine), reposant sur des mémoires
de traductions. Ces systèmes se développent à côté des systèmes
de TA homogènes et de THAM, et les supplanteront peut-être à moyen
terme.
Leurs différents composants de TA seront construits par des équipes
différentes, distribuées autour de la planète, avec des méthodes
algorithmiques et des outils différents (langages spécialisés ou
LSPL), ainsi que des ressources et composants linguiciels différents
(dictionnaires et corpus de divers types, grammaires et transducteurs
basés sur des règles), à l'aide d'EDL (environnements de
développement linguiciel) eux aussi différents. Les contributions de
la thèse concernent en particulier :
l'amélioration des « méta-EDL de TAO », permettant d'effectuer une
transition incrémentale entre les EDL natifs des systèmes de TA
utilisés pour construire un systèmes de TAO à composants
hétérogènes, et un futur EDL intégrateur universel, dans lequel on
pourra « rapatrier » la compilation et l'exécution des LSPL ;
la conception et la réalisation d'une base lexicale partageant un
même pivot lexical, PIVAX, réalisée au-dessus de la plate-forme
Jibiki (G. Sérasset, GETALP) ;
la réingénierie de langages spécialisés « externes » (non
supportés par l'EDL Ariane-G5), avec application aux « systèmes-Q
» (A. Colmerauer, 1967), qui servit de base pendant 15 ans au système
de TA TAUM-météo destiné aux bulletins météorologiques canadiens ;
la conception et la réalisation d'un « moniteur » adapté à la
partie « production » d'un système de TAO hétérogène, EMEU_w.1.0,
qui a été développé et utilisé dans le cadre d'un projet de grande
ampleur.
Mots-clés : TA et TAO hétérogène, BDLM, réingénierie de LSPL, EDL.
========================================================================
Abstract:
The thesis deals with problems posed by the design andimplementation
of the software part of CAT (Computer Automated Translation) systems,
integrating multiple MT (Machine Translation) systems and/or MT
systems with heterogeneous components, as well as a MAHT (Machine
Aided Human Translation) part, based on translation memories. These
systems are emerging beside homogeneous MT systems and MAHT system,
and may replace them in the middle term.
Their various MT components will be built by different teams,
distributed around the world, using different algorithmic methods and
different tools (Specialized Languages or SLLP), as well as different
lingware resoures and components (corpora and dictionaries of various
types, rule-based grammars and transducers), and developing under
different lingware development environments (EDL). The contributions
of the thesis concern especially:
the improvement of the "meta-EDL for CAT systems", allowing to carry
out an incremental transition between the native EDLs of the MT
systems used for building a heterogeneous MT system, and a future
"universal integrating EDL", in which it will be possible to
reengineer the compilers and engines (interpreters) of the SLLPs from
various systems;
the design and the implementation of PIVAX, a contributive lexical
database for heterogeneous CAT systems sharing the same "lexical
pivot", built over the Jibiki platform (G.Sérasset, GETALP);
the reengineering of "external" specialized languages (not supported
by the EDL of Ariane-G5), with an application to the "Q-Systems" (A.
Colmerauer, 1967) that was for 15 years the basis of the TAUM-meteo MT
system used to translate the Canadian weather bulletins ;
the design and the implementation of EMEU_w.1.0, a "monitor" handling
the "production" part of a heterogeneous CAT system, that has been
used in the framework of a large-scale project
Keywords: heterogeneous CAT, MT, lexical database, SLLP reengineering,
EDL (environment for lingware development).
========================================================================
Cordialement,
============================
Hong-Thai NGUYEN
Email: Hong-Thai.Nguyen at imag.fr
GETALP-LIG
385 rue de la Biblioth∂e`que BP 53
38041 Grenoble cedex
France
Tel.: + 33 4 7651 4817
Fax.: + 33 4 7663 5686
GSM.: + 33 6 27 04 86 22
IM (Yahoo): thaichat04, (Skype): thaichat04
Page: http://www-clips.imag.fr/geta/User/hong-thai.nguyen/Welcome.html
-------------------------------------------------------------------------
Message diffuse par la liste Langage Naturel <LN at cines.fr>
Informations, abonnement : http://www.atala.org/article.php3?id_article=48
English version :
Archives : http://listserv.linguistlist.org/archives/ln.html
http://liste.cines.fr/info/ln
La liste LN est parrainee par l'ATALA (Association pour le Traitement
Automatique des Langues)
Information et adhesion : http://www.atala.org/
-------------------------------------------------------------------------
More information about the Ln
mailing list