Soutenance de Thèse d'Olivier BLANC

jean_pierre_heymann heymann at UNIV-MLV.FR
Thu Dec 7 13:29:02 UTC 2006


Spécialité :         Informatique Linguistique

Nom-Prénom :   BLANC Olivier

Date :                  Vendredi 8 décembre 2006, à 10h30
Lieu :                   Amphi Maurice Gross, batiment Copernic, UMLV

Jury :
DANLOS Laurence, Professeur, univ Paris 7, UMR CNRS 8094 - Lattice - 
Talana, univ Paris 7
FAIRON Cédrick, Professeur, univ Catholique de Louvain, Belgique, 
Cental, Collège Erasme, univ Catholique de Louvain, Belgique
GUENTHNER Franz, Professeur, Ludwig Maximilians univ. Allemagne, 
Centrum für Informations und Sprachverarbeitung, Ludwig Maximilians
univ.
LAPORTE Eric, Professeur, univ Marne la Vallée, UMR CNRS 8049 - 
LabInfo, IGM,  univ Marne la Vallée
MAUREL Denis, Professeur, univ F. Rabelais Tours, EA 2101 - lab 
d'Informatique, univ F. Rabelais Tours

Titre :
Algorithmes d'analyse syntaxique par grammaires lexicalisées : 
optimisation et traitement de l'ambiguité

Résumé :
Nos recherches portent sur l'analyse automatique de textes par 
application de grammaires lexicalisées en utilisant des ressources 
linguistiques à large couverture. Dans ce contexte, nous avons 
approfondi nos travaux dans trois domaines : l'algorithmique, la 
réalisation d'applications utilisables dans un contexte industriel et
l'analyse syntaxique profonde.

En ce qui concerne le premier point, nous avons implémenté des 
algorithmes originaux pour l'optimisation des grammaires locales en 
préalable à leur utilisation pour l'analyse et nous proposons un 
algorithme efficace pour l'application de ce type de grammaire sur un 
texte. Notre algorithme améliore le traitement des ambiguïtés 
lexicales et syntaxiques. Nous montrons par des évaluations
chiffrées  que nos algorithmes permettent de traiter de gros volumes
de données  textuelles en combinaison avec des ressources
linguistiques fines et à  large couverture.

Au niveau applicatif, nous avons participé au développement de la 
plate-forme RNTL Outilex dédiée aux traitements automatiques de
textes  écrits. L'architecture modulaire de la plate-forme et sa
licence peu  restrictive (LGPL) permet la réalisation, à faible
coût,  d'applications hybrides mélangeant les méthodes à
base de ressources  linguistiques avec les méthodes statistiques.

Enfin, le troisième axe de nos recherches porte sur l'exploitation
des  tables du lexique-grammaire, pour l'analyse syntaxique profonde et 
l'extraction des prédicats et de leurs arguments dans les textes 
français. A cet effet, nous avons fait évoluer le formalisme de
nos  grammaires vers un formalisme à structure de traits. Les
équations sur  les traits qui décorent notre grammaire nous
permettent de résoudre de  manière déclarative différents
phénomènes syntaxiques et de  représenter de manière
formelle les résultats d'analyse. Nous  présentons notre grammaire
du français dans l'état actuel, qui est  générée de
manière semi-automatique à partir des tables du lexique 
grammaire, et nous donnons des évaluations de sa couverture lexicale 
et syntaxique.


-------------- next part --------------
An HTML attachment was scrubbed...
URL: <http://listserv.linguistlist.org/pipermail/parislinguists/attachments/20061207/b3daf786/attachment.htm>


More information about the Parislinguists mailing list