These: Fran çois-Regis Chaumartin - Antelope, une plate-forme =?WINDOWS-1252?Q?_de_TAL_permettant_d=92extraire_?=les sens du texte

Thierry Hamon thierry.hamon at UNIV-PARIS13.FR
Fri Sep 7 20:13:59 UTC 2012


Date: Thu, 6 Sep 2012 22:56:06 +0000
From: François-Régis Chaumartin <frc at proxem.com>
Message-ID: <A8F04EA93386E24E8477049CCE3CFFD465FC7491 at ikhexmbx01-n1.ikhex.ikoula.com>
X-url: http://www.proxem.com


Bonjour,

J'ai le plaisir de vous inviter à la soutenance de ma thèse intitulée 
« Antelope, une plate-forme de TAL permettant d’extraire les sens du
texte – Théorie et applications de l’interface syntaxe-sémantique » qui
aura lieu le mardi 25 septembre 2012 à 16h15 en salle 1D06 (1er étage) à
l'UFRL, 175 rue du Chevaleret, 75013 Paris. Vous êtes conviés au
traditionnel pot qui suivra.

François-Régis Chaumartin

ALPAGE
Web : www.proxem.com - Twitter : @proxem

[ Résumé ]

Créer rapidement un analyseur sémantique dédié à une tâche particulière
n’est pas une tâche aisée. En effet, composants d’analyse et ressources
linguistiques sont souvent définis avec des formats incompatibles entre
eux, ce qui en rend l’assemblage complexe.

Nous souhaitons apporter une réponse opérationnelle à ce problème avec
la plate-forme de traitement linguistique Antelope, dont cette thèse
décrit les principes de conception et de réalisation. En partie basée
sur la Théorie Sens-Texte (TST), Antelope permet une analyse syntaxique
et sémantique de corpus de volume important ; son objectif est de «
rendre calculable » du texte tout-venant : avis de consommateurs, textes
encyclopédiques, documents RH, articles de presse…

Pour cela, Antelope intègre (i) plusieurs composants prêts à l’emploi,
couvrant les principales tâches de TAL, qui interagissent au sein d’un
modèle de données linguistiques unifié ; (ii) un lexique sémantique
multilingue à large couverture constitué à partir de différentes
sources. Un effort d’intégration permet d’offrir une plate-forme robuste
et homogène ; l’ensemble constitue une interface syntaxe-sémantique
opérationnelle.

La thèse présente la plate-forme et la compare à d’autres projets de
référence ; elle souligne les bonnes pratiques à prendre en termes
d’architecture logicielle pour qu’un tel ensemble complexe reste
maintenable ; elle introduit aussi une démarche semi-supervisée
d’acquisition de connaissances à large échelle.

[ Mots clés ]

Traitement de corpus, analyse syntaxique et sémantique, lexique
sémantique, acquisition de connaissances à large échelle,
désambiguïsation, extraction d’information, résolution d’anaphores et de
coréférences, Théorie Sens-Texte.

[ Jury ]

Présidente

- Laurence DANLOS, Professeur des universités, Université Paris Diderot
  (Paris 7)

Rapporteurs

- Adeline NAZARENKO, Professeur des universités, LIPN–Université Paris
  Nord (Paris 13)

- Pierre ZWEIGENBAUM, Directeur de recherche, LIMSI–CNRS

Examinateurs

- Christian JACQUELINET, Médecin des hôpitaux, Agence de la Biomédecine,
  Lim&Bio

- Guy PERRIER, Professeur des universités, LORIA–University Nancy 2

Directeur de thèse

- Sylvain KAHANE, Professeur des universités, Université Paris Ouest
  Nanterre

-------------------------------------------------------------------------
Message diffuse par la liste Langage Naturel <LN at cines.fr>
Informations, abonnement : http://www.atala.org/article.php3?id_article=48
English version       : 
Archives                 : http://listserv.linguistlist.org/archives/ln.html
                                http://liste.cines.fr/info/ln

La liste LN est parrainee par l'ATALA (Association pour le Traitement
Automatique des Langues)
Information et adhesion  : http://www.atala.org/
-------------------------------------------------------------------------



More information about the Ln mailing list