Habilitation: Matthieu Constant, Mettre les expressions multi-mots au coeur du TAL

Thierry Hamon thierry.hamon at UNIV-PARIS13.FR
Tue Nov 20 20:43:54 UTC 2012


Date: Tue, 20 Nov 2012 16:17:12 +0100
From: Matthieu Constant <Matthieu.Constant at univ-mlv.fr>
Message-ID: <50AB9EF8.5010907 at univ-mlv.fr>

Chers collègues,

J'ai le plaisir de vous inviter à ma soutenance d'HDR le 3 décembre
prochain, à 14h30, à l'Université Paris-Est Marne-la-Vallée. Elle se
déroulera au Laboratoire d'Informatique Gaspard-Monge (LIGM), dans la
salle 4B08R, 4e étage, batiment Copernic.

Pour accéder au LIGM, vous pouvez suivre le lien suivant:
http://igm.univ-mlv.fr/LIGM/address_and_access/

Bien cordialement,
Matthieu Constant
Université Paris-Est Marne-la-Vallée

******************************************************

Titre: Mettre les expressions multi-mots au coeur du Traitement
Automatique des Langues - sur l'exploitation de ressources lexicales


Résumé:

Durant cette soutenance, nous nous attacherons à retracer les différents
travaux de recherche que nous avons menés depuis plus de 10 ans. L'un de
nos objectifs principaux a été d'améliorer la finesse linguistique de
différentes tâches du TAL en prenant en compte les expressions
multi-mots. En particulier, notre idée directrice a été d'exploiter des
ressources lexicales riches et de les coupler à différents modèles
probabilistes ou différentes procédures hybrides. Nos travaux peuvent se
découper en trois axes.

Le premier axe porte sur l'étiquetage morphosyntaxique et l'analyse
syntaxique. L'intégration de la reconnaissance des expressions
multi-mots dans telles tâches a essentiellement consisté à adapter
divers modèles probabilistes dédiés à ces tâches. Comme ces expressions
sont, par définition, difficilement prédictibles, l'exploitation de
ressources lexicales est primordiale pour leur reconnaissance. Nous
avons donc été amené à trouver des stratégies d'intégration de
ressources symboliques externes dans nos modèles.

Le deuxième axe consiste à intégrer la reconnaissance d'expressions
multi-mots dans des applications. Nous avons, en particulier, développé
des applications liées au monde privé (extraction d'informations,
classification) ou liées au monde académique (aide à la construction de
lexiques bilingues ou à des études linguistiques). Dans tous les cas,
nous nous sommes basé sur des prétraitements fins alimentés par des
ressources lexicales riches.

Le troisième axe concerne la construction de ressources linguistiques.
En effet, le développement des outils décrits ci-dessus n'est possible
que grâce à l'existence de ressources (corpus annotés ou lexiques). Or,
les ressources autour des expressions multi-mots manquent cruellement ou
sont incomplètes. Pour toutes les ressources développées, nous avons
mené des études linguistiques fines et systématiques. Nous avons
également mis en place un outillage informatique pour les gérer et les
appliquer à des textes.


Jury:

Prof. Béatrice Daille (Université de Nantes) [examinatrice]
Prof. Laurence Danlos (Université Paris 7) [examinatrice]
Prof. Cédrick Fairon (Université catholique de Louvain) [examinateur]
Prof. Eric Laporte  (Universidade Federal do Espírito Santo) [examinateur]
Prof. Alexis Nasr (Université Aix-Marseille) [rapporteur]
Prof. Eric Wehrli (Université de Genève) [rapporteur]
Prof. François Yvon (Université Paris-Sud) [rapporteur]

*************************************************************

-------------------------------------------------------------------------
Message diffuse par la liste Langage Naturel <LN at cines.fr>
Informations, abonnement : http://www.atala.org/article.php3?id_article=48
English version       : 
Archives                 : http://listserv.linguistlist.org/archives/ln.html
                                http://liste.cines.fr/info/ln

La liste LN est parrainee par l'ATALA (Association pour le Traitement
Automatique des Langues)
Information et adhesion  : http://www.atala.org/
-------------------------------------------------------------------------



More information about the Ln mailing list