Job: Post-doc, apprentissage automatique pour le TAL, Lifo, Universite d'Orleans

Thierry Hamon thierry.hamon at LIPN.UNIV-PARIS13.FR
Fri Dec 19 16:24:59 UTC 2008


Date: Fri, 19 Dec 2008 15:15:36 +0100
From: Isabelle Tellier <isabelle.tellier at univ-orleans.fr>
Message-ID: <494BAC88.9050600 at univ-orleans.fr>
X-url: http://crotal.gforge.inria.fr/pmwiki-2.1.27/
X-url: http://ifarm.nl/signll/conll/
X-url: http://ufal.mff.cuni.cz/conll2009-st/
X-url: http://www.univ-orleans.fr/lifo/


Sujet de post-doc informatique, apprentissage automatique pour le TAL

Dans le cadre du projet ANR CRoTAL
(http://crotal.gforge.inria.fr/pmwiki-2.1.27/), un post-doc de 8 mois
est à pourvoir dès que possible. L'objectif du travail à réaliser est
de mettre en oeuvre le modèle des CRFs (Champs Conditionnels
Aléatoires), pour apprendre à annoter des corpus textuels ou
arborés. Les CRFs sont un modèle statistique très puissant donnant
actuellement les meilleurs résultats pour des tâches comme
l'acquisition d'étiquettes syntaxiques ou l'extraction d'entités
nommées. Il n'est pas nécessaire de connaître ce modèle pour postuler
au post-doc : diverses bibliothèques permettant d'utiliser les CRFs
existent déjà, il suffira de les utiliser.

Une des applications envisagées est celle proposée dans le cadre de la
« shared task » de la conférence CoNLL
(http://ifarm.nl/signll/conll/), qui portera sur l'analyse en
dépendances syntaxique et sémantique multilingue
(http://ufal.mff.cuni.cz/conll2009-st/). Le travail consistera donc
notamment à étudier comment cette tâche peut-être modélisée comme un
problème pour lequel les CRFs sont applicables, et à intégrer des
ressources existantes dans les programmes d'apprentissage.

- le lieu du post-doc : Lifo, université d'Orléans
  (http://www.univ-orleans.fr/lifo/)

- compétences souhaitées : programmation de scripts (Python ou Perl)
  pour la manipulation de corpus, mise en oeuvre d'expériences
  d'apprentissage automatique à partir de données, un minimum
  d'intérêt pour les tâches d'ingénierie linguistique, des
  connaissances en grammaires de dépendances seraient un plus

- personnes à contacter : isabelle.tellier at univ-orleans.fr,
  denys.duchier at univ-orleans.fr

*****************************

Post-doc in Machine Learning and Computational Linguistics

An 8 months post-doc position is available for the French ANR-project
CRoTAL (http://crotal.gforge.inria.fr/pmwiki-2.1.27/), to be started
as soon as possible. The scientific purpose is to apply the model of
CRFs (Conditional Random Fields) to learn to annotate textual corpora
or treebanks. CRFs is a very powerful statistical model at the state
of the art level for many linguistic tasks such as Part-Of-Speech
labeling of Named Entity extraction. It is not necessary to know CRFs
to apply for the post-doc : CRFs-libraries are already available, the
main task will be to use them.

One of the targeted applications is the one proposed by the "shared
task" of the CoNLL conference (http://ifarm.nl/signll/conll/), which
will be about "Syntactic and Semantic dependencies in Multiple
Languages" (http://ufal.mff.cuni.cz/conll2009-st/). What will have to
be carrefully studied is how to model the problem so that CRFs can be
applied to it, and how existing linguistic ressources can be
integrated into the learning machinery.

- place : Lifo, university of Orléans, France
  (http://www.univ-orleans.fr/lifo/?lang=en)

- required knowledge : a script programming language (Python or Perl)
  for corpora engineering, experience in machine learning from data,
  interest for computational linguistics, knowledge about dependency
  formalisms would be a plus

- persons to contact : isabelle.tellier at univ-orleans.fr,
  denys.duchier at univ-orleans.fr

-------------------------------------------------------------------------
Message diffuse par la liste Langage Naturel <LN at cines.fr>
Informations, abonnement : http://www.atala.org/article.php3?id_article=48
English version       : 
Archives                 : http://listserv.linguistlist.org/archives/ln.html
                                http://liste.cines.fr/info/ln

La liste LN est parrainee par l'ATALA (Association pour le Traitement
Automatique des Langues)
Information et adhesion  : http://www.atala.org/
-------------------------------------------------------------------------



More information about the Ln mailing list