These: Romain Brixtel, Alignement endogene de documents

Thierry Hamon thierry.hamon at UNIV-PARIS13.FR
Wed Jan 12 08:15:33 UTC 2011


Date: Sun, 09 Jan 2011 03:47:13 +0100
From: rbrixtel at info.unicaen.fr
Message-ID: <courier.4D2921B1.00007D32 at averell>

Bonjour, 

J'ai le plaisir de vous convier à ma soutenance de thèse en
informatique qui aura lieu le jeudi 13 Janvier à 14h00 en salle des
thèses de l'université de Caen Basse-Normandie (S3 102 1er étage),
campus 2, bâtiment sciences 3, UFR des sciences.

Vous êtes cordialement invités au pot de thèse qui suivra la
soutenance et qui aura lieu dans la salle S3-351, bâtiment sciences 3.

Titre : Alignement endogène de documents, une approche multilingue et
multi-échelle

Jury :
M. Eric Gaussier, Professeur, université de Grenoble (rapporteur)
M. Emmanuel Morin, Professeur, université de Nantes (rapporteur)
M. Pierre Zweigenbaum, Directeur de recherche, LIMSI-CNRS
M. Emmanuel Giguet, Chargé de recherche, GREYC-CNRS
Mme Christine Durieux, Professeure, université de Caen (co-directrice)
M. Jacques Vergne, Professeur, université de Caen (directeur) 

Résumé :
Cette thèse s'inscrit dans le domaine de la traduction automatique et
concerne plus précisément l'alignement, c'est-à-dire l'extraction
d'éléments (mots, syntagmes ou encore phrases) en relation de
traduction dans des corpus parallèles.
Les méthodes employées, pour aligner automatiquement ces éléments en
relation de traduction, sont endogènes (sans ressources extérieures)
et multi-échelles (différents niveaux d'analyse sont traités).  Nous
proposons une stratégie d'alignement renouvelant les approches basées
sur la phrase et le mot en exploitant les niveaux sur-phrastique et
sous-phrastique, respectivement l'alinéa et le chunk.  L'alignement
d'alinéas s'effectue via les indices de rendu visuel alors que
l'alignement sous-phrastique s'intéresse à l'implication des chaînes
de caractères pour un alignement de chunks.
Nous montrons aussi les connexions entre l'alignement et l'aide à la
détection de plagiat au sein de corpus de code source en vue de
proposer une abstraction du modèle.

Romain Brixtel

-------------------------------------------------------------------------
Message diffuse par la liste Langage Naturel <LN at cines.fr>
Informations, abonnement : http://www.atala.org/article.php3?id_article=48
English version       : 
Archives                 : http://listserv.linguistlist.org/archives/ln.html
                                http://liste.cines.fr/info/ln

La liste LN est parrainee par l'ATALA (Association pour le Traitement
Automatique des Langues)
Information et adhesion  : http://www.atala.org/
-------------------------------------------------------------------------



More information about the Ln mailing list