Seminaire: INFOLINGU, Isabelle Tellier, 8 novembre 2010

Thierry Hamon thierry.hamon at UNIV-PARIS13.FR
Sat Oct 30 13:15:57 UTC 2010


Date: Thu, 28 Oct 2010 12:16:40 +0200
From: Myriam RAKHO <rakho.myriam at gmail.com>
Message-ID: <AANLkTin8CL11eUmnoteXTLEFXvqExpyM=GoY_33qMmi3 at mail.gmail.com>

************************************************************************
INFOLINGU
Le séminaire de l'équipe Informatique Linguistique
de l'Institut Gaspard Monge (LIGM)
************************************************************************

Date : *Le Lundi 8 novembre 2010 à 10h30*

Lieu :  Université Paris-Est Marne-la-Vallée
          Bâtiment Copernic, 4ème étage, salle de séminaire.

*Toute personne intéressée est la bienvenue.*

************************************************************************

Intervenante :

 *   Isabelle TELLIER (LIFO, Université d'Orléans)*

Titre de la présentation :

*    **Variations linguistiques sur les CRF *
*    Mettre un peu de sens dans le monde du calcul brut*

Résumé :

Les CRF ("Conditional Random Fields" ou "Champs Markoviens
Conditionnels") sont une famille de modèles graphiques discriminants
nés récemment dans le domaine du TAL (Lafferty, McCallum et Pereira
2001, Sutton et McCallum 2006), qui permettent d'apprendre à annoter
des données en se basant sur un ensemble d'exemples déjà annotés. Ils
ont donné d'excellents résultats (souvent les meilleurs) pour
différentes tâches pouvant se ramener à l'étiquetage de séquences
d'unités linguistiques (reconnaissance d'entités nommées et extraction
d’information (McCallum et Li, 2003, Pinto et al., 2003), étiquetage
en partie de discours

(Altun et al., 2003), analyse syntaxique peu profonde (Sha et Pereira,
2003)...).  Ils peuvent aussi être employés pour l'étiquetage de
données structurées comme les pages HTML ou les corpus arborés (Cohn
et Blunsom 2005, Jousse 2007, Moreau et al 2009, Moreau et Tellier
2009) et même inspirer la conception de nouveaux analyseurs
syntaxiques (Finkel, Kleeman & Manning 2008).  Dans cet exposé, nous
commencerons par expliquer les fondements de ce modèle.  Nous
montrerons ensuite que leur attrait pour les linguistes vient de ce
qu'ils permettent d'intégrer facilement de plusieurs façons
différentes des ressources linguistiques externes de diverses natures,
et combinent ainsi naturellement connaissances symboliques et
apprentissage statistique. Nous illustrerons cette souplesse
d'utilisation via deux applications distinctes : l'étiquetage en
partie du discours de phrases françaises et l'identification des rôles
thématiques dans un corpus arboré.

références :

Altun Y. , Johnson M. & Hofmann T. (2003).
   Investigating loss functions and optimization methods for
   discriminative learning of label sequences.
   In Proceedings of EMNLP.

Cohn T. & Blunsom P. (2005).
   Semantic role labelling with tree conditional random fields.
   In (Carreras & Marquez, 2005).
Finkel J. R., Kleeman A. & Manning C. D. (2008).
   Efficient, Feature-based, Conditional Random Field Parsing,
   Proceedings of ACL/HLT-2008, pp. 959-967.
Jousse F. (2007).
   Transformations d’Arbres XML avec des Modèles Probabilistes pour
   l’Annotation,
   thèse de l'Université Charles de Gaulle - Lille 3.
Lafferty J . , McCallum A. & Pereira F. (2001).
   Conditional random fields : Probabilistic models for segmenting and
   labeling sequence data.
   In Proceedings of ICML’01, p. 282–289.
McCallum A. & Li W. (2003).
   Early results for named entity recognition with conditional random
   fields.
   In Proceedings of CoNLL 2003.
Moreau E. & Tellier I . (2009).
   The crotal srl system : a generic tool based on tree-structured crf.
   In proceedings of CoNNL 2009.
Moreau E., Tellier I., Balvet A., Laurence G., Rozenknop A. & Poibeau T.
   Annotation fonctionnelle de corpus arborés avec des Champs
   Aléatoires Conditionnels,
   TALN 2009, Senlis.
Sha F. & Pereira F. (2003).
   Shallow parsing with conditional random fields.
   In Technical Report CIS TR MS-CIS-02-35, University of
   Pennsylvania, 2003.
Sutton C. & McCallum A. (2006).
   An Introduction to Conditional Random Fields for Relational
   Learning,
   In L. Getoor & B. Taskar, Eds., Introduction to Statistical
   Relational Learning. MIT Press.

-------------------------------------------------------------------------
Message diffuse par la liste Langage Naturel <LN at cines.fr>
Informations, abonnement : http://www.atala.org/article.php3?id_article=48
English version       : 
Archives                 : http://listserv.linguistlist.org/archives/ln.html
                                http://liste.cines.fr/info/ln

La liste LN est parrainee par l'ATALA (Association pour le Traitement
Automatique des Langues)
Information et adhesion  : http://www.atala.org/
-------------------------------------------------------------------------



More information about the Ln mailing list