Job: Ingenieur expert - Projet ANR MDCA Passage
Thierry Hamon
thierry.hamon at LIPN.UNIV-PARIS13.FR
Fri Oct 3 15:00:58 UTC 2008
Date: Wed, 01 Oct 2008 10:43:34 +0200
From: Eric De la Clergerie <Eric.De_La_Clergerie at inria.fr>
Message-ID: <48E33836.1040300 at inria.fr>
X-url: http://atoll.inria.fr/passage
X-url: http://alpage.inria.fr
X-url: http://www.jobingenieur.com/Ingenieur-en-traitement
X-url: http://alpage.inria.fr/~clerger
Offre d'emploi : ingénieur expert - Projet ANR MDCA Passage
Titre: Gestion de corpus annotés en syntaxe
Dans le cadre du projet ANR Passage (Produire des Annotations
Syntaxiques À Grande Échelle -- http://atoll.inria.fr/passage),
l'équipe ALPAGE (INRIA Rocquencourt et Paris 7 --
http://alpage.inria.fr) recherche un ingénieur pour un contrat à durée
déterminée de 12 mois.
S'inscrivant dans le domaine du Traitement Automatique des Langues
(TAL), le projet Passage vise à utiliser plusieurs chaînes de
traitement syntaxique pour produire des annotations syntaxiques sur un
corpus d'au moins 100 millions de mots, pour combiner ces annotations
à l'aide de techniques de vote par majorité (ROVER) et pour utiliser
ces annotations combinées pour des tâches d'acquisition de
connaissances lexicales.
Mission:
La mission principale consiste à compléter le développement
de EasyRef, un outil WEB 2.0 de gestion d'annotations
syntaxiques développé dans le cadre de Passage
(fonctionnalités existantes: visualisation, comparaison,
édition, rapports de bugs, mini langage de requêtes, ...). À
terme, EasyRef doit permettre aux participants d'accéder aux
corpus, de déposer leurs annotations et de pouvoir exploiter
celles-ci (visualisation, recherche, évaluation).
Un défi important concerne le passage à l'échelle de EasyRef
pour permettre la gestion d'une dizaine de jeux d'annotations
sur 100 millions de mots, en s'appuyant sur des technologies
efficaces de bases de données (relationnelles et/ou XML).
Un effort de développement doit aussi être mené sur un
langage de requêtes plus puissant et efficace que celui
existant, pour des requêtes interactives mais aussi en mode
batch.
Enfin, au travers de l'outil EasyRef et du langage de
requêtes, le candidat sera amené à interagir sur les tâches
d'acquisition de connaissances à partir d'annotations
syntaxiques.
D'autre part, le candidat pourra être amené à participer à
des tâches de nettoyage des corpus, au fur et à mesure de
l'identification de problèmes dans ceux-ci.
Compétences souhaitées:
* Gestion de corpus linguistiques annotés (si possible en
syntaxe)
* Perl (EasyRef est en Perl/Catalyst)
* Bases de données (relationnelles et si possible XML)
* Technologies XML
* Technologies WEB 2.0 (HTML, javascript, Services WEB)
Informations pratiques
Adresse : INRIA Rocquencourt
Type et durée : CDD 12 mois
Début : au plus tard Janvier 2009
Lien: http://www.jobingenieur.com/Ingenieur-en-traitement
Merci d'adresser votre dossier de candidature (lettre de motivation +
cv) à
Eric de la Clergerie <Eric.De_La_Clergerie at inria.fr>
ou au travers de http://www.jobingenieur.com/Ingenieur-en-traitement
--
Eric.De_La_Clergerie at inria.fr Equipe Alpage - INRIA Rocquencourt
WWW Home Page: http://alpage.inria.fr/~clerger
-------------------------------------------------------------------------
Message diffuse par la liste Langage Naturel <LN at cines.fr>
Informations, abonnement : http://www.atala.org/article.php3?id_article=48
English version :
Archives : http://listserv.linguistlist.org/archives/ln.html
http://liste.cines.fr/info/ln
La liste LN est parrainee par l'ATALA (Association pour le Traitement
Automatique des Langues)
Information et adhesion : http://www.atala.org/
-------------------------------------------------------------------------
More information about the Ln
mailing list