These: Olivier BLANC, Algorithmes d'analyse syntaxique par grammaires lexicalisees

Thierry Hamon thierry.hamon at LIPN.UNIV-PARIS13.FR
Mon Dec 11 08:30:31 UTC 2006


Date: Thu, 07 Dec 2006 16:36:55 +0100
From: Jean-Pierre Heymann <Jean-Pierre.Heymann at univ-mlv.fr>
Message-ID: <45783517.3000809 at univ-mlv.fr>


Spécialité :         Informatique Linguistique

Nom-Prénom :  

Date :                  Vendredi 8 décembre 2006, à 10h30
Lieu :                   Amphi Maurice Gross, batiment Copernic, UMLV

Jury :
DANLOS Laurence, Professeur, univ Paris 7, UMR CNRS 8094 - Lattice - 
Talana, univ Paris 7
FAIRON Cédrick, Professeur, univ Catholique de Louvain, Belgique, 
Cental, Collège Erasme, univ Catholique de Louvain, Belgique
GUENTHNER Franz, Professeur, Ludwig Maximilians univ. Allemagne, Centrum 
für Informations und Sprachverarbeitung, Ludwig Maximilians univ.
LAPORTE Eric, Professeur, univ Marne la Vallée, UMR CNRS 8049 - LabInfo, 
IGM,  univ Marne la Vallée
MAUREL Denis, Professeur, univ F. Rabelais Tours, EA 2101 - lab 
d'Informatique, univ F. Rabelais Tours

Titre :
Algorithmes d'analyse syntaxique par grammaires lexicalisées : 
optimisation et traitement de l'ambiguité

Résumé :
Nos recherches portent sur l'analyse automatique de textes par
application de grammaires lexicalisées en utilisant des ressources
linguistiques à large couverture. Dans ce contexte, nous avons
approfondi nos travaux dans trois domaines : l'algorithmique, la
réalisation d'applications utilisables dans un contexte industriel et
l'analyse syntaxique profonde.

En ce qui concerne le premier point, nous avons implémenté des 
algorithmes originaux pour l'optimisation des grammaires locales en 
préalable à leur utilisation pour l'analyse et nous proposons un 
algorithme efficace pour l'application de ce type de grammaire sur un 
texte. Notre algorithme améliore le traitement des ambiguïtés lexicales 
et syntaxiques. Nous montrons par des évaluations chiffrées que nos 
algorithmes permettent de traiter de gros volumes de données textuelles 
en combinaison avec des ressources linguistiques fines et à large 
couverture.

Au niveau applicatif, nous avons participé au développement de la 
plate-forme RNTL Outilex dédiée aux traitements automatiques de textes 
écrits. L'architecture modulaire de la plate-forme et sa licence peu 
restrictive (LGPL) permet la réalisation, à faible coût, d'applications 
hybrides mélangeant les méthodes à base de ressources linguistiques avec 
les méthodes statistiques.

Enfin, le troisième axe de nos recherches porte sur l'exploitation des 
tables du lexique-grammaire, pour l'analyse syntaxique profonde et 
l'extraction des prédicats et de leurs arguments dans les textes 
français. A cet effet, nous avons fait évoluer le formalisme de nos 
grammaires vers un formalisme à structure de traits. Les équations sur 
les traits qui décorent notre grammaire nous permettent de résoudre de 
manière déclarative différents phénomènes syntaxiques et de représenter 
de manière formelle les résultats d'analyse. Nous présentons notre 
grammaire du français dans l'état actuel, qui est générée de manière 
semi-automatique à partir des tables du lexique grammaire, et nous 
donnons des évaluations de sa couverture lexicale et syntaxique.


-------------------------------------------------------------------------
Message diffuse par la liste Langage Naturel <LN at cines.fr>
Informations, abonnement : http://www.atala.org/article.php3?id_article=48
English version       : 
Archives                 : http://listserv.linguistlist.org/archives/ln.html
                                http://liste.cines.fr/info/ln

La liste LN est parrainee par l'ATALA (Association pour le Traitement
Automatique des Langues)
Information et adhesion  : http://www.atala.org/
-------------------------------------------------------------------------



More information about the Ln mailing list