Soutenance de Thèse d'Olivier BLANC
jean_pierre_heymann
heymann at UNIV-MLV.FR
Thu Dec 7 13:29:02 UTC 2006
Spécialité : Informatique Linguistique
Nom-Prénom : BLANC Olivier
Date : Vendredi 8 décembre 2006, à 10h30
Lieu : Amphi Maurice Gross, batiment Copernic, UMLV
Jury :
DANLOS Laurence, Professeur, univ Paris 7, UMR CNRS 8094 - Lattice -
Talana, univ Paris 7
FAIRON Cédrick, Professeur, univ Catholique de Louvain, Belgique,
Cental, Collège Erasme, univ Catholique de Louvain, Belgique
GUENTHNER Franz, Professeur, Ludwig Maximilians univ. Allemagne,
Centrum für Informations und Sprachverarbeitung, Ludwig Maximilians
univ.
LAPORTE Eric, Professeur, univ Marne la Vallée, UMR CNRS 8049 -
LabInfo, IGM, univ Marne la Vallée
MAUREL Denis, Professeur, univ F. Rabelais Tours, EA 2101 - lab
d'Informatique, univ F. Rabelais Tours
Titre :
Algorithmes d'analyse syntaxique par grammaires lexicalisées :
optimisation et traitement de l'ambiguité
Résumé :
Nos recherches portent sur l'analyse automatique de textes par
application de grammaires lexicalisées en utilisant des ressources
linguistiques à large couverture. Dans ce contexte, nous avons
approfondi nos travaux dans trois domaines : l'algorithmique, la
réalisation d'applications utilisables dans un contexte industriel et
l'analyse syntaxique profonde.
En ce qui concerne le premier point, nous avons implémenté des
algorithmes originaux pour l'optimisation des grammaires locales en
préalable à leur utilisation pour l'analyse et nous proposons un
algorithme efficace pour l'application de ce type de grammaire sur un
texte. Notre algorithme améliore le traitement des ambiguïtés
lexicales et syntaxiques. Nous montrons par des évaluations
chiffrées que nos algorithmes permettent de traiter de gros volumes
de données textuelles en combinaison avec des ressources
linguistiques fines et à large couverture.
Au niveau applicatif, nous avons participé au développement de la
plate-forme RNTL Outilex dédiée aux traitements automatiques de
textes écrits. L'architecture modulaire de la plate-forme et sa
licence peu restrictive (LGPL) permet la réalisation, à faible
coût, d'applications hybrides mélangeant les méthodes à
base de ressources linguistiques avec les méthodes statistiques.
Enfin, le troisième axe de nos recherches porte sur l'exploitation
des tables du lexique-grammaire, pour l'analyse syntaxique profonde et
l'extraction des prédicats et de leurs arguments dans les textes
français. A cet effet, nous avons fait évoluer le formalisme de
nos grammaires vers un formalisme à structure de traits. Les
équations sur les traits qui décorent notre grammaire nous
permettent de résoudre de manière déclarative différents
phénomènes syntaxiques et de représenter de manière
formelle les résultats d'analyse. Nous présentons notre grammaire
du français dans l'état actuel, qui est générée de
manière semi-automatique à partir des tables du lexique
grammaire, et nous donnons des évaluations de sa couverture lexicale
et syntaxique.
-------------- next part --------------
An HTML attachment was scrubbed...
URL: <http://listserv.linguistlist.org/pipermail/parislinguists/attachments/20061207/b3daf786/attachment.htm>
More information about the Parislinguists
mailing list