These: Mohamed Mahdi Malik, Structures predicatives nominales
Thierry Hamon
thierry.hamon at UNIV-PARIS13.FR
Tue Jan 26 21:02:47 UTC 2010
Date: Tue, 26 Jan 2010 14:36:04 +0100
From: Mohamed Mahdi MALIK <malik.mohamed.mahdi at lif.univ-mrs.fr>
Message-ID: <4B5EEFC4.9020207 at lif.univ-mrs.fr>
Bonjour,
J'ai le plaisir de vous convier à ma soutenance de thèse de doctorat
intitulée « Structures prédicatives nominales : acquisition de données
lexicales pour l'analyse automatique de textes».
La soutenance aura lieu le jeudi 28 janvier 2010 à 14h30, Amphi 12,
Faculté des Sciences de Luminy (Marseille).
Vous êtes également invités au pot qui suivra.
Composition du jury :
- Brigitte Grau, Professeure à l'ENSIIE (École nationale supérieure
d'informatique pour l'industrie et l'entreprise), LIMSI (Laboratoire
d'Informatique pour la Mécanique et les Sciences de l'Ingénieur).
- Guy Lapalme, Professeur à l'Université de Montréal, RALI
(laboratoire de Recherche Appliquée en Linguistique Informatique).
- Alexis Nasr, Professeur à l'Université d'Aix-Marseille II, LIF
(Laboratoire d'Informatique Fondamentale de Marseille).
- Jean Royauté, Chargé de Recherche, CNRS, LIF (Laboratoire
d'informatique Fondamentale de Marseille). co-directeur de thèse
- Paul Sabatier, Directeur de Recherche, CNRS, LIF (Laboratoire
d'informatique Fondamentale de Marseille). co-directeur de thèse
- Max Silberztein, Professeur à l'Université de Franche-Comté, LASELDI
(LAboratoire de SEmiotique, Linguistique, Didactique et
Informatique) , Besançon.
Bien cordialement,
Mehdi Malik
************Résumé******************************************************
Dans le domaine du traitement automatique des langues, la question qui
nous intéresse dans cette thèse est celle des relations qui peuvent
exister entre des prédicats verbaux (ex : corroder) et des prédicats
nominaux (ex : corrosion) dont les structures argumentales mettent en
jeu des informations communes (salt corrodes iron / le sel corrode le
fer ; iron is corroded by salt / le fer est corrodé par le sel ; the
corrosion of iron by salt / la corrosion du fer par le sel). Les
prédicats nominaux dotés de leurs arguments donnent lieu à des groupes
nominaux prédicatifs (GNpréd). La mise en évidence de l'équivalence
des structures argumentales des prédicats verbaux et des GNPréd est
fondamentale pour pouvoir réaliser, par exemple, des systèmes
d'extraction automatique d'informations performants.
Dans cette thèse nous nous livrons à une formalisation des conditions
dans lesquelles se réalisent des relations d'équivalence entre les
deux types de constructions (verbales et nominales). De façon plus
appliquée, nous nous intéressons à l'explicitation de ces relations
dans un lexique anglais de la biologie, cela à partir des données
fournies par le Specialist Lexicon. En se basant sur les données de ce
lexique que l'on peut qualifier de génériques car elles couvrent un
spectre large qui va de la biologie, la médecine aux sciences
sociales, nous proposons une prédiction raisonnable du comportement
syntaxique des arguments nominaux lorsqu'ils sont en position de
postmodifieur. Nous confirmons le rôle que peuvent jouer les
prépositions dans la détermination et l'acquisition des différents
arguments nominaux. Nous mettons en évidence les structures
distributionnelles et fonctionnelles du GNpréd ainsi que les
différentes formes équivalentes qu'un GNpréd peut avoir. Le
comportement syntaxique des GNpréd dépend de la classe grammaticale du
prédicat verbal à partir duquel la nominalisation a été dérivée et de
son schéma de complémentation. Les prédicats verbaux peuvent être
répartis en deux grandes classes : les prédicats transitifs qui
admettent un complément d'objet direct (COD) et les prédicats qui n'en
admettent pas. Les GNpréd associés à ces deux classes se caractérisent
par le fait que la préposition of sélectionne soit le sujet, soit le
COD et qu'elle est un marqueur ambigu lorsqu'elle apparaît
seule. Cependant, cette ambiguïté disparaît lorsque les GNpréd sont
saturés, c.-à-d. lorsque tous les arguments de la relation
décrite par le nom prédicatif sont réalisés.
Cette étude nous a conduit à concevoir un ensemble d'algorithmes et à
développer une plate-forme, PredicateDB, permettant de produire, à
partir de ces algorithmes, un lexique où sont explicités pour chaque
nominalisation (nom prédicatif) du Specialist Lexicon ses structures
argumentales et ses réalisations dans des GNpréd dont les arguments
sont marqués par des prépositions spécifiques. Les 3 981 entrées du
lexique produit sont représentées par les nominalisations et leurs
différentes propriétés, c'est-à-dire, pour chaque nominalisation : les
formes saturées de chaque emploi verbal et les cas d'indécidabilité de
leur fonction argumentale qui sont liés au rôle ambigu de la
préposition of en tant que marqueur pour les formes non
saturées. Enfin, à titre d'illustration, nous montrons la pertinence
du lexique produit pour l'extraction d'informations dans le domaine de
la biologie.
-------------------------------------------------------------------------
Message diffuse par la liste Langage Naturel <LN at cines.fr>
Informations, abonnement : http://www.atala.org/article.php3?id_article=48
English version :
Archives : http://listserv.linguistlist.org/archives/ln.html
http://liste.cines.fr/info/ln
La liste LN est parrainee par l'ATALA (Association pour le Traitement
Automatique des Langues)
Information et adhesion : http://www.atala.org/
-------------------------------------------------------------------------
More information about the Ln
mailing list