Habilitation: François Yvon, Des apprentis pour le Traitement Automatique des Langues

Thierry Hamon thierry.hamon at LIPN.UNIV-PARIS13.FR
Fri Nov 24 15:00:55 UTC 2006


Date: Thu, 23 Nov 2006 23:31:44 +0100 (CET)
From: François Yvon <yvon at enst.fr>
Message-ID: <35829.82.225.68.200.1164321104.squirrel at webmail.enst.fr>


J'ai le plaisir de vous inviter à la soutenance de mon habilitation à
diriger des recherches, intitulée "Des apprentis pour le Traitement
Automatique des Langues".

Cette soutenance aura  lieu
                  le mardi 28 novembre 2006 à 10h30
                      à l'ENST, 46 rue Barrault,
                     dans l'amphithéâtre Emeraude

devant un jury composé de MM.
       - M. Elbèze (Univ. Avignon),
       - B. Habert (Univ. Paris X),
       - P. Gallinari (Univ. Paris VI),
       - R. Gilleron (Univ. Lille III),
       - L. Lebart (ENST/CNRS),
       - J. Mariani (LIMSI/CNRS)

-----------

Résumé:

En l'espace d'une grosse décennie, le domaine du traitement
automatique des langues (TAL) s'est trouvé profondément transformé par
la (re)découverte et la diffusion de méthodes dites "à base de
corpus". En appliquant des modèles statistiques de plus en plus
sophistiqués à des corpus de plus en plus volumineux, il est apparu
que l'on pouvait bâtir des outils de traitement efficaces, répondant à
une très large gamme de problèmes, notamment des problèmes de
désambuiguïsation.  Au compte de ces méthodes, en particulier, leur
capacité à se passer de toute représentation explicite de
connaissances linguistiques, les rendant à même de traiter des corpus
issus de domaines, de genres, de registres, voire de langues très
variés.

Un rapide survol historique de cette évolution, illustré par des
exemples d'applications empruntés au domaine de la fouille de textes,
permettra de relever un certain nombre de principes communs à ces
outils, mais également de souligner des difficultés et des travers
qu'ils partagent: obligation de reformuler des problèmes comme des
problèmes de décision, difficultés liées à l'estimation en très grande
dimension en présence de bruit et de données éparses, etc.

Par contraste, l'apprentissage par analogie est une méthode
d'apprentissage symbolique qui cherche à exploiter le caractère
systématique des oppositions formelles observées dans certains types
de données linguistiques. La validité de cette démarche s'appuie sur
des arguments aussi bien linguistiques qu'empiriques, qui répondent en
partie aux objections adressées aux modélisations statistiques.

En présentant mon interprétation de l'apprentissage par analogie, je
montrerai qu'en partant d'une définition générale de la notion
d'opposition formelle envisagé comme un rapport de proportion, il est
possible de dériver des algorithmes efficaces pour calculer et
résoudre des proportions analogiques, donnant lieu à un mécanisme
générique d'apprentissage par analogie. Ce mécanisme sera illustré par
des expériences conduites sur diverses tâches d'acquisition de
régularités lexicales. Je discuterai enfin, dans ma conclusion, des
perspectives ouvertes par ces travaux.

-- 
Francois Yvon
ENST / Dpt of Computer Science & Networks
46 rue Barrault - F 75013 PARIS
01 45 81 77 59
www.infres.enst.fr/~yvon


-------------------------------------------------------------------------
Message diffuse par la liste Langage Naturel <LN at cines.fr>
Informations, abonnement : http://www.atala.org/article.php3?id_article=48
English version       : 
Archives                 : http://listserv.linguistlist.org/archives/ln.html
                                http://liste.cines.fr/info/ln

La liste LN est parrainee par l'ATALA (Association pour le Traitement
Automatique des Langues)
Information et adhesion  : http://www.atala.org/
-------------------------------------------------------------------------



More information about the Ln mailing list