Habilitation: Ludovic Tanguy, Complexification des donnees et des techniques en linguistique

Thierry Hamon thierry.hamon at UNIV-PARIS13.FR
Thu Aug 16 08:27:14 UTC 2012


Date: Tue, 14 Aug 2012 17:49:52 +0200
From: Ludovic Tanguy <ludovic.tanguy at univ-tlse2.fr>
Message-ID: <502A73A0.1050002 at univ-tlse2.fr>
X-url: http://w3.erss.univ-tlse2.fr/membre/tanguy/HDR/Memoire-HDR-Tanguy.pdf


J'ai le plaisir de vous annoncer que je soutiendrai mon habilitation à
diriger des recherches en linguistique le mardi 11 septembre 2012 à 14h
à la maison de le recherche de l'université de Toulouse le Mirail (salle
D29).

Mon mémoire est intitulé :

"Complexification des données et des techniques en linguistique :
contributions du traitement automatique des langues aux solutions et aux
problèmes"

Le jury est composé de :

Anne Condamines, CLLE-ERSS (promotrice)
Benoît Habert, ENS de Lyon (examinateur)
Marie-Paule Péry-Woodley, CLLE-ERSS (examinatrice)
Pascale Sébillot, IRISA (examinatrice)
Mathieu Valette, INALCO (rapporteur)
François Yvon, LIMSI (rapporteur)

Le document est disponible en ligne à l'adresse suivante :

http://w3.erss.univ-tlse2.fr/membre/tanguy/HDR/Memoire-HDR-Tanguy.pdf

Vous êtes chaleureusement conviés à assister à la soutenance, ainsi qu'à 
participer au pot qui suivra.


---Résumé du mémoire ---

Ce mémoire d'habilitation est l'occasion de faire le bilan de mon
activité d'enseignant-chercheur en traitement automatique des langues
(TAL) dans un laboratoire de linguistique (CLLE-ERSS) et des principales
évolutions de l'outillage informatique de la linguistique au cours des
15 dernières années.

Mes recherches portent notamment sur le repérage de structures
morphosyntaxiques dans les textes, l'analyse des structures du discours
et l'acquisition de ressources lexicales à partir de corpus. Certaines
se positionnent dans des cadres applicatifs comme la recherche
d'information et la classification de textes, mais aussi dans des
contextes plus spécifiques en lien avec d'autres disciplines (médecine,
psychologie, sociologie...).

En m'appuyant sur la diversité de ces travaux et de mes collaborations,
j'identifie quatre dimensions d'évolution principales :

- l'augmentation de la masse de données langagières disponibles et
  notamment la part croissante de l'utilisation du Web comme corpus ;

- la complexification de l'outillage informatique disponible pour gérer
  la masse et la variété des données accessibles (outils de constitution
  et d'interrogation de corpus) ;

- la complexification de l'annotation des données langagières, qu'elle
  soit manuelle, assistée ou automatique ;

- la montée en puissance, en TAL mais aussi en linguistique descriptive,
  des méthodes quantitatives (depuis l'analyse statistique jusqu'aux
  techniques de fouille de données et d'apprentissage).

Si les avancées techniques du TAL ont permis d'accroître de façon
conséquente les potentialités d'investigation du matériau langagier, et
dans certains cas de dégager de nouveaux questionnements, elles ont
aussi contribué à creuser un fossé entre les deux composantes
(informatique et linguistique) de la discipline.

A travers ma propre expérience d'acteur ou d'accompagnateur de ces
changements et avec une vocation de "passeur" interdisciplinaire, je
cherche à dégager les principaux enjeux actuels pour la linguistique
outillée :

- doter la linguistique descriptive d'outils de visualisation de données
  pour aborder la complexité, en exploitant les avancées théoriques et
  techniques de ce nouveau champ disciplinaire et en les adaptant aux
  spécificités du matériau langagier ;

- rendre abordables aux linguistes les techniques fondamentales de
  l'analyse statistique, mais aussi les méthodes d'apprentissage
  artificiel seules capables d'assister l'investigation et
  l'exploitation de données massives et complexes ;

- replacer la linguistique au sein des développements actuels du TAL,
  notamment par le biais de l'utilisation de descripteurs linguistiques
  riches dans les outils de traitement par apprentissage, pour un
  bénéfice mutuel.

-------------------------------------------------------------------------
Message diffuse par la liste Langage Naturel <LN at cines.fr>
Informations, abonnement : http://www.atala.org/article.php3?id_article=48
English version       : 
Archives                 : http://listserv.linguistlist.org/archives/ln.html
                                http://liste.cines.fr/info/ln

La liste LN est parrainee par l'ATALA (Association pour le Traitement
Automatique des Langues)
Information et adhesion  : http://www.atala.org/
-------------------------------------------------------------------------



More information about the Ln mailing list