These: Sylwia Ozdowska, ALIBI, un systeme d'ALIgnement BIlingue a base de regles de propagation syntaxique

Thierry Hamon thierry.hamon at LIPN.UNIV-PARIS13.FR
Mon Dec 11 08:31:28 UTC 2006


Date: Thu, 7 Dec 2006 18:28:28 +0100
From: Sylwia Ozdowska<ozdowska at univ-tlse2.fr>
Message-ID: <sympa.1165511888.6143.143 at cines.fr>


J'ai le plaisir de vous inviter à la soutenance de ma thèse qui
s'intitule:

"ALIBI, un système d'ALIgnememt BIlingue à base de règles de
propagation syntaxique"

La soutenance aura lieu le jeudi 14 décembre à 9h30, salle D29 (Maison
de la Recherche, Université Toulouse-le Mirail) devant un jury composé
de:

Didier Bourigault (ERSS/CNRS & Université Toulouse-le Mirail)
Philippe Langlais (Université de Montréal)
Marie-Paule Péry-Woodley (Université Toulouse-le Mirail)
Jean Véronis (Université de Provence)
Pierre Zweigenbaum (LIMSI/CNRS) 

Elle sera suivie d'un pot auquel vous êtes également conviés.

Résumé:

L'alignement consiste en la mise en correspondance, dans un corpus
parallèle composé d'un texte S et de sa traduction T, de segments
textuels qui sont potentiellement la traduction les uns des autres.

Cette mise en correspondance peut s'effectuer à différents niveaux de
segmentation: paragraphes, phrases, syntagmes ou mots. D'abord
purement statistiques, les systèmes d'alignement au niveau des mots ou
des syntagmes se sont progressivement enrichis en incorporant des
connaissances linguistiques, notamment syntaxiques.

Je m'intéresse à l'utilisation de relations de dépendance bilingues en
tant que générateur de liens d'alignement via le processus de
propagation syntaxique. La principe en est le suivant: il s'agit de
partir d'un couple de mots qui sont potentiellement traduction l'un de
l'autre dans une biphrase et d'aligner les mots qui sont en relation
syntaxique avec chaque élément de ce couple. C'est ce principe de
propagation, exprimé sous forme de règles d'alignement, qui est mis en
oeuvre dans le système ALIBI. Les règles d'alignement peuvent être
définies manuellement sur la base d'une expertise linguistique et
d'observations en corpus mais elles peuvent également être inférées
automatiquement par une technique d'apprentissage artificiel, ce qui
confère une plus-value indéniable à la méthode développée en terme
d'adaptabilité et donc de portabilité. Pour tenir compte de la
dimension inter-corpus, ces deux dispositifs sont testés sur trois
corpus parallèles anglais/français: un corpus de textes scientifiques,
un corpus de textes institutionnels et un corpus de débats
parlementaires.  L'évaluation est effectuée par rapport à des
références multi-juges construites à cet effet.

-- 
Sylwia Ozdowska

ERSS & Université de Toulouse-Le Mirail
5, allées Antonio Machado
F - 31058 Toulouse Cedex 01

Fax  : +33 (0)5 61 50 46 77


-------------------------------------------------------------------------
Message diffuse par la liste Langage Naturel <LN at cines.fr>
Informations, abonnement : http://www.atala.org/article.php3?id_article=48
English version       : 
Archives                 : http://listserv.linguistlist.org/archives/ln.html
                                http://liste.cines.fr/info/ln

La liste LN est parrainee par l'ATALA (Association pour le Traitement
Automatique des Langues)
Information et adhesion  : http://www.atala.org/
-------------------------------------------------------------------------



More information about the Ln mailing list