HDR: Emmanuel Morin, Synergie des approches et des ressources deployees pour le traitement de l'ecrit

Tue Nov 27 20:59:23 UTC 2007

Date: Mon, 26 Nov 2007 11:12:34 +0100
From: Emmanuel Morin <Emmanuel.Morin at univ-nantes.fr>
Message-ID: <474A9C12.6040504 at univ-nantes.fr>

Bonjour à tous,

J'ai le plaisir de vous annoncer la soutenance de mon Habilitation à 
Diriger des Recherches
le* vendredi 30 novembre à 14h30* en salle 3 au LINA (Facultés Sciences 
et Techniques) à Nantes.

Bien cordialement,

Emmanuel
--

*Titre*
Synergie des approches et des ressources déployées pour le traitement de 
l'écrit

*Jury*
Béatrice Daille - Professeur des universités (Université de Nantes) -
examinatrice
Eric Gaussier - Professeur des universités  (Université Joseph Fourier) 
- rapporteur
Grégrory Grefenstette - Ingénieur de recherche (CEA) - rapporteur
Christian Viard-Gaudin - Professeur des universités (Université de 
Nantes) - examinateur
Pierre Zweigenbaum - Directeur de recherche (LIMSI-CNRS) - rapporteur

*Résumé*
Les travaux présentés dans le cadre de cette Habilitation à Diriger
des Recherches, qui se situent au carrefour de l'informatique et de la
linguistique, s'intéressent au traitement de l'écrit. Ils s'articulent
autour de deux axes de recherche, celui de la fouille terminologique
multilingue et celui de la reconnaissance de l'écriture manuscrite en
ligne.

Dans un premier temps, notre étude est consacrée à la fouille
terminologique multilingue. Nous commençons par rappeler les
fondements théoriques en acquisition lexicale multilingue, qui
s'inscrivent dans l'héritage de la sémantique distributionnelle de
Harris. Nous présentons ensuite les travaux réalisés en acquisition de
lexiques bilingues à partir de corpus comparables. Nous décrivons
notamment la méthode par similarité interlangue proposée pour
l'alignement de termes complexes et la plate-forme informatique
associée. À la lumière des nombreux résultats que nous avons engrangés
dans ce champ de recherche, nous précisons les apports et limites des
différentes approches utilisées.

Dans un deuxième temps, nous présentons les différentes facettes de la
reconnaissance de l'écriture manuscrite en ligne auxquelles nous nous
sommes intéressénuel Morins et les modèles développés. Ces travaux,
qui se situent au niveau de la modélisation du langage naturel, visent
à concevoir des modèles de langage adaptés à la reconnaissance de
documents dénotant un « écrit standard » (où un stylo numérique vient
remplacer la saisie sur un clavier numérique) ou un « écrit déviant »
(où un stylo numérique s'offre comme une nouvelle alternative pour
l'écriture de SMS). Nous présentons les modèles développés et les
résultats obtenus. Nous revenons aussi sur l'importance et la
difficulté de concevoir des ressources adaptées à la prise en compte
de ces différents écrits.

Dans un dernier temps, qui constitue le trait d'union entre nos deux
axes de recherche, nous indiquons la synergie possible entre les
approches et ressources déployées. En particulier, nous montrons que
les méthodes probabilistes ne sont plus une alternative aux systèmes à
base de règles, mais bien complémentaires et que les ressources
exploitées doivent être adaptées à la tâche visée.

-------------------------------------------------------------------------
Message diffuse par la liste Langage Naturel <LN at cines.fr>
Informations, abonnement : http://www.atala.org/article.php3?id_article=48
English version       : 
Archives                 : http://listserv.linguistlist.org/archives/ln.html
                                http://liste.cines.fr/info/ln

La liste LN est parrainee par l'ATALA (Association pour le Traitement
Automatique des Langues)
Information et adhesion  : http://www.atala.org/
-------------------------------------------------------------------------