Seminaire: Alpage, Isabelle Tellier, vendredi 1er octobre
Thierry Hamon
thierry.hamon at UNIV-PARIS13.FR
Fri Sep 24 20:09:03 UTC 2010
Date: Fri, 24 Sep 2010 15:06:43 +0200
From: Benoit Crabbé <bcrabbe at linguist.jussieu.fr>
Message-Id: <28930188-9719-44FF-A3D9-2691655592D6 at linguist.jussieu.fr>
**************** Séminaire Alpage *******************
Séminaire de l'école doctorale de Paris 7
Il s'agit du séminaire de recherche en linguistique informatique
organisé par l'équipe Alpage, Alpage est une équipe mixte Inria --
Paris 7 qui centre ses intérêts scientifiques autour de l'analyse
syntaxique automatique et du traitement du discours pour la langue
française.
Le séminaire se tiendra vendredi 1er octobre à 11.00 en salle 131 à
l'UFRL, 30 rue du château des rentiers, 75013 Paris
Toute personne intéressée est la bienvenue.
************************************************************************
Isabelle Tellier (LIFO, Orléans)
nous parlera de :
Variations linguistiques sur les CRF: mettre un peu de sens dans le
monde du calcul brut
Résumé:
Les CRF ("Conditional Random Fields" ou "Champs Markoviens
Conditionnels") sont une famille de modèles graphiques discriminants
nés récemment dans le domaine du TAL (Lafferty, McCallum et Pereira
2001, Sutton et McCallum 2006), qui permettent d'apprendre à annoter
des données en se basant sur un ensemble d'exemples déjà annotés. Ils
ont donné d'excellents résultats (souvent les meilleurs) pour
différentes tâches pouvant se ramener à l'étiquetage de séquences
d'unités linguistiques (reconnaissance d'entités nommées et extraction
d’information (McCallum et Li, 2003, Pinto et al., 2003), étiquetage
en partie de discours (Altun et al., 2003), analyse syntaxique peu
profonde (Sha et Pereira, 2003)...). Ils peuvent aussi être employés
pour l'étiquetage de données structurées comme les pages HTML ou les
corpus arborés (Cohn et Blunsom 2005, Jousse 2007, Moreau et al 2009,
Moreau et Tellier 2009) et même inspirer la conception de nouveaux
analyseurs syntaxiques (Finkel, Kleeman & Manning 2008). Dans cet
exposé, nous commencerons par expliquer rapidement les fondements de
ce modèle. Nous montrerons ensuite que leur attrait pour les
linguistes vient de ce qu'ils permettent d'intégrer facilement de
plusieurs façons différentes des ressources linguistiques externes de
diverses natures, et combinent ainsi naturellement connaissances
symboliques et apprentissage statistique. Nous illustrerons cette
souplesse d'utilisation via deux applications distinctes :
l'étiquetage en partie du discours de phrases françaises et
l'identification des rôles thématiques dans un corpus arboré.
Bibliographie:
Altun Y. , Johnson M. & Hofmann T. (2003). Investigating loss
functions and optimization methods for discriminative learning of
label sequences. In Proceedings of EMNLP.
Cohn T. & Blunsom P. (2005). Semantic role labelling with tree
conditional random fields. In (Carreras & Marquez, 2005).
Finkel J. R., Kleeman A. & Manning C. D. (2008). Efficient,
Feature-based, Conditional Random Field Parsing, Proceedings of
ACL/HLT-2008, pp. 959-967.
Jousse F. (2007). Transformations d’Arbres XML avec des Modèles
Probabilistes pour l’Annotation, thèse de l'Université Charles de
Gaulle - Lille 3.
Lafferty J . , McCallum A. & Pereira F. (2001). Conditional random
fields : Probabilistic models for segmenting and labeling sequence
data. In Proceedings of ICML’01, p. 282–289.
McCallum A. & Li W. (2003). Early results for named entity recognition
with conditional random fields. In Proceedings of CoNLL 2003.
Moreau E. & Tellier I . (2009). The crotal srl system : a generic tool
based on tree-structured crf. In proceedings of CoNNL 2009.
Moreau E., Tellier I., Balvet A., Laurence G., Rozenknop A. & Poibeau
T. : Annotation fonctionnelle de corpus arborés avec des Champs
Aléatoires Conditionnels, TALN 2009, Senlis.
Sha F. & Pereira F. (2003). Shallow parsing with conditional random
fields. In Technical Report CIS TR MS-CIS-02-35, University of
Pennsylvania, 2003.
Sutton C. & McCallum A. (2006). An Introduction to Conditional Random
Fields for Relational Learning, In L. Getoor & B. Taskar, Eds.,
Introduction to Statistical Relational Learning. MIT Press.
Programme prévisionnel des séminaires à venir:
15 octobre : Philippe de Groote (Loria, Calligramme)
12 novembre : Federico Sangati (UvA)
26 novembre : Kata Gabor (Alpage)
-------------------------------------------------------------------------
Message diffuse par la liste Langage Naturel <LN at cines.fr>
Informations, abonnement : http://www.atala.org/article.php3?id_article=48
English version :
Archives : http://listserv.linguistlist.org/archives/ln.html
http://liste.cines.fr/info/ln
La liste LN est parrainee par l'ATALA (Association pour le Traitement
Automatique des Langues)
Information et adhesion : http://www.atala.org/
-------------------------------------------------------------------------
More information about the Ln
mailing list