Job: Post-doc, apprentissage automatique pour le TAL, Lifo, Universite d'Orleans
Thierry Hamon
thierry.hamon at LIPN.UNIV-PARIS13.FR
Fri Dec 19 16:24:59 UTC 2008
Date: Fri, 19 Dec 2008 15:15:36 +0100
From: Isabelle Tellier <isabelle.tellier at>
Message-ID: <494BAC88.9050600 at>
Sujet de post-doc informatique, apprentissage automatique pour le TAL
Dans le cadre du projet ANR CRoTAL
(, un post-doc de 8 mois
est à pourvoir dès que possible. L'objectif du travail à réaliser est
de mettre en oeuvre le modèle des CRFs (Champs Conditionnels
Aléatoires), pour apprendre à annoter des corpus textuels ou
arborés. Les CRFs sont un modèle statistique très puissant donnant
actuellement les meilleurs résultats pour des tâches comme
l'acquisition d'étiquettes syntaxiques ou l'extraction d'entités
nommées. Il n'est pas nécessaire de connaître ce modèle pour postuler
au post-doc : diverses bibliothèques permettant d'utiliser les CRFs
existent déjà, il suffira de les utiliser.
Une des applications envisagées est celle proposée dans le cadre de la
« shared task » de la conférence CoNLL
(, qui portera sur l'analyse en
dépendances syntaxique et sémantique multilingue
( Le travail consistera donc
notamment à étudier comment cette tâche peut-être modélisée comme un
problème pour lequel les CRFs sont applicables, et à intégrer des
ressources existantes dans les programmes d'apprentissage.
- le lieu du post-doc : Lifo, université d'Orléans
- compétences souhaitées : programmation de scripts (Python ou Perl)
pour la manipulation de corpus, mise en oeuvre d'expériences
d'apprentissage automatique à partir de données, un minimum
d'intérêt pour les tâches d'ingénierie linguistique, des
connaissances en grammaires de dépendances seraient un plus
- personnes à contacter : isabelle.tellier at,
denys.duchier at
Post-doc in Machine Learning and Computational Linguistics
An 8 months post-doc position is available for the French ANR-project
CRoTAL (, to be started
as soon as possible. The scientific purpose is to apply the model of
CRFs (Conditional Random Fields) to learn to annotate textual corpora
or treebanks. CRFs is a very powerful statistical model at the state
of the art level for many linguistic tasks such as Part-Of-Speech
labeling of Named Entity extraction. It is not necessary to know CRFs
to apply for the post-doc : CRFs-libraries are already available, the
main task will be to use them.
One of the targeted applications is the one proposed by the "shared
task" of the CoNLL conference (, which
will be about "Syntactic and Semantic dependencies in Multiple
Languages" ( What will have to
be carrefully studied is how to model the problem so that CRFs can be
applied to it, and how existing linguistic ressources can be
integrated into the learning machinery.
- place : Lifo, university of Orléans, France
- required knowledge : a script programming language (Python or Perl)
for corpora engineering, experience in machine learning from data,
interest for computational linguistics, knowledge about dependency
formalisms would be a plus
- persons to contact : isabelle.tellier at,
denys.duchier at
Message diffuse par la liste Langage Naturel <LN at>
Informations, abonnement :
English version :
Archives :
La liste LN est parrainee par l'ATALA (Association pour le Traitement
Automatique des Langues)
Information et adhesion :
More information about the Ln
mailing list