Habilitation: Cecile Fabre, Affinites syntaxiques et semantiques entre mots

Thierry Hamon thierry.hamon at UNIV-PARIS13.FR
Sat Nov 20 17:41:46 UTC 2010


Date: Sat, 20 Nov 2010 09:49:16 +0100
From: Cecile.Fabre at univ-tlse2.fr
Message-ID: <20101120094916.8ujh4iwioggkgcgw at webmail.univ-tlse2.fr>
X-url: http://w3.erss.univ-tlse2.fr/textes/pagespersos/cfabre/index.html


J'ai le plaisir de vous convier à la soutenance de mon HDR en
linguistique le lundi 29 novembre, à 14h, en salle D29 de la maison de
la recherche de l'Université Toulouse 2 - Le Mirail.

Ce travail, intitulé "Affinités syntaxiques et sémantiques entre mots
: apports mutuels de la linguistique et du traitement automatique des
langues", sera présenté devant un jury composé de :

M.-P. PÉRY-WOODLEY (directrice), professeur, Université Toulouse 2,
   CLLE-ERSS
A. NAZARENKO (rapporteur), professeur, Université Paris 13 - Nord, LIPN
A. POLGUERE (rapporteur) : professeur, Université Nancy 2, ATILF
B. HABERT : professeur, ENS de Lyon et Délégué information et
   connaissance auprès du Secrétaire Général d'EDF R&D
N. HATHOUT : Chargé de recherche HDR, Université Toulouse 2, CLLE-ERSS
P. MERLO : Maître d'enseignement et de recherche, Université de Genève,
   LATL
A. TUTIN : Maître de conférences HDR, Université Stendhal Grenoble 3, LIDILEM

Le document de synthèse se trouve sur ma page :
http://w3.erss.univ-tlse2.fr/textes/pagespersos/cfabre/index.html


Résumé :

Je présente un bilan des travaux que j'ai menés depuis mon recrutement
à l'Université de Toulouse 2 - Le Mirail (1997) dans le domaine de la
linguistique et du Traitement Automatique des Langues.  J'ai exploré
le lien entre ces deux disciplines de deux façons que j'estime
complémentaires : tout d'abord, je considère le champ applicatif du
TAL comme un terrain d'investigation important pour la linguistique.

Le TAL, et de façon générale, les applications relevant du domaine de
l'ingénierie des langues, sollicitent un renouvellement des objets
d'étude de la linguistique et élargissent le champ de ses
questionnements. En retour, la linguistique gagne à s'appuyer sur des
procédures de découverte issues du TAL, basées sur le traitement de
corpus numérisés et annotés et sur le recours à des techniques de
quantification adaptées aux besoins de la description linguistique.

Au sein de ce cadre général, les travaux que j'ai menés ont porté
principalement sur deux thématiques de recherche que j'ai résumées
sous les termes d'affinités sémantiques et syntaxiques.

Le premier concerne la question du repérage des rapports de proximité
sémantique entre différents types d'unités (mots, termes, structures
prédicatives). Identifier sous la diversité des formulations des
éléments de contenu similaire est un objectif crucial pour de
nombreuses applications qui visent l'accès à l'information dans les
textes. Dans cette perspective, j'ai cherché à considérer sur le plan
linguistique cette question de la proximité sémantique, en faisant en
particulier appel à des techniques d'analyse distributionnelle
automatique qui visent à calculer les rapprochements sémantiques entre
mots sur la base de la similarité de leur comportement syntaxique dans
les corpus. Cette approche inductive des relations de sens déborde
largement les limites des relations classiquement décrites en
linguistique et sollicite des procédures nouvelles de description et
de validation.

Le second volet concerne la question des affinités syntaxiques entre
mots : impliquée dans le projet de développement et d'exploitation
d'un analyseur syntaxique automatique, syntex, je me suis intéressée à
une question qui est au coeur des problèmes d'ambiguïté syntaxique, à
savoir le rattachement des groupes prépositionnels. J'ai travaillé en
particulier à la mise au point d'une méthode permettant de distinguer
des types différents de rattachement prépositionnel, de nature
argumentale ou adjonctive. Dans ce cas également, mon travail est
guidé par un objectif qui relève du TAL (améliorer les performances
d'un analyseur), et ce projet m'a amenée en retour à retravailler une
question linguistique centrale en syntaxe, la distinction entre
arguments et circonstants, et à développer des méthodes d'analyse de
corpus qui permettent de substituer à une conception binaire de ces
notions une appréciation plus graduelle de l'autonomie du groupe
prépositionnel par rapport au verbe.

Je propose donc de montrer comment les outils de TAL appliqués aux
corpus offrent à la linguistique des instruments d'observation et
d'expérimentation qui permettent d'aborder les faits langagiers à
partir des usages et sous l'angle de la quantification. Ma conviction
est que la linguistique ainsi outillée peut jouer un rôle plus
important sur les nombreux terrains applicatifs qui nécessitent
l'analyse de données langagières.


Cécile Fabre
maître de conférences
département de Sciences du langage&   CLLE-ERSS (UMR 5263)
Université Toulouse 2 - Le Mirail
5 allées A. Machado
31058 Toulouse Cedex 9
Tél. labo : 05 61 50 36 93 (bureau B521)
Tél. dépt : 05 61 50 41 61 (bureau 1672) ou 43 14 (secrétariat)
cecile.fabre at univ-tlse2.fr
http://www.univ-tlse2.fr/erss/membres/cfabre/

-------------------------------------------------------------------------
Message diffuse par la liste Langage Naturel <LN at cines.fr>
Informations, abonnement : http://www.atala.org/article.php3?id_article=48
English version       : 
Archives                 : http://listserv.linguistlist.org/archives/ln.html
                                http://liste.cines.fr/info/ln

La liste LN est parrainee par l'ATALA (Association pour le Traitement
Automatique des Langues)
Information et adhesion  : http://www.atala.org/
-------------------------------------------------------------------------



More information about the Ln mailing list