These: Julien Bourdaillet, Alignement textuel monolingue avec recherche de deplacements

Thierry Hamon thierry.hamon at LIPN.UNIV-PARIS13.FR
Fri Nov 30 20:13:11 UTC 2007


Date: Wed, 28 Nov 2007 11:01:58 +0100 (CET)
From: "Julien Bourdaillet" <julien.bourdaillet at lip6.fr>
Message-ID: <2354.132.227.204.60.1196244118.squirrel at mailone.lip6.fr>
X-url: http://www.lip6.fr/fr/informations/comment.html


Bonjour,

J'ai le plaisir de vous inviter à ma soutenance de thèse intitulée «
Alignement textuel monolingue avec recherche de déplacements:
algorithmique pour la critique génétique » ainsi qu'au pot qui suivra.

La soutenance se déroulera le lundi 3 décembre 2007 à 10H30 en salle
549 au Laboratoire d'Informatique de Paris 6, 104 avenue du président
Kennedy, 75016 - Paris. Le plan d'accès est consultable à l'adresse
suivante: http://www.lip6.fr/fr/informations/comment.html (demander un
badge visiteur à l'accueil et prévoir une pièce d'identité).

Composition du jury:
Maxime Crochemore - Professeur, Université de Marne-la-Vallée (Rapporteur)
Béatrice Daille - Professeur,  Université de Nantes (Rapporteur)
Jean-Gabriel Ganascia - Professeur, Université Pierre et Marie Curie
(Directeur)
Philippe Langlais - Maître de conférences,  Université de Montréal
Jean-Louis Lebrave - Directeur de recherche, Ecole Normale Supérieure
Patrice Perny - Professeur,  Université Pierre et Marie Curie

Résumé:
Ce travail de thèse répond à une problématique suscitée par la
critique génétique textuelle. Cette discipline étudie la genèse des
oeuvres littéraires grâce aux brouillons d'écrivains en recherchant,
entre autres, les déplacements entre deux versions d'un même
texte. Ceci nous amené à définir la problématique de l'alignement
textuel monolingue avec recherche de déplacements.

D'un point de vue informatique, nous avons mis à jour la nécessité de
calculer un alignement entre deux textes de type distance d'édition
avec recherche des déplacements, ce qui est NP-difficile. De plus,
notre objectif était l'obtention d'un algorithme efficace permettant
le passage à l'échelle, ce qui permet d'envisager la recherche des
déplacements dans de longs textes comme des livres. Il devait
également permettre l'alignement de textes très différents, tout en
identifiant les modifications au caractère près.

Nous proposons une formalisation en un problème d'optimisation
combinatoire multiobjectif intégrant un objectif syntaxique. Celle-ci
permet de résoudre théoriquement de petites instances du problème avec
un solveur SAT, mais ne permet pas le passage à l'échelle.

Un algorithme d'alignement de séquences basé sur l'alignement par
fragments est proposé. En bioinformatique, cette technique permet de
traiter des génomes de mammifères. Notre algorithme est basé sur la
coordination de la résolution des recouvrements entre occurrences
d'une répétition. Il résout le problème avec une complexité efficace
et passe à l'échelle. De plus, il présente de meilleurs résultats que
les méthodes existantes et est maintenant utilisé par les généticiens
du texte afin d'étudier les brouillons d'écrivains.

--

Cordialement,

Julien Bourdaillet


-------------------------------------------------------------------------
Message diffuse par la liste Langage Naturel <LN at cines.fr>
Informations, abonnement : http://www.atala.org/article.php3?id_article=48
English version       : 
Archives                 : http://listserv.linguistlist.org/archives/ln.html
                                http://liste.cines.fr/info/ln

La liste LN est parrainee par l'ATALA (Association pour le Traitement
Automatique des Langues)
Information et adhesion  : http://www.atala.org/
-------------------------------------------------------------------------



More information about the Ln mailing list