Job: Ingenieur expert - Projet ANR MDCA Passage

Thierry Hamon thierry.hamon at LIPN.UNIV-PARIS13.FR
Fri Oct 3 15:00:58 UTC 2008


Date: Wed, 01 Oct 2008 10:43:34 +0200
From: Eric De la Clergerie <Eric.De_La_Clergerie at inria.fr>
Message-ID: <48E33836.1040300 at inria.fr>
X-url: http://atoll.inria.fr/passage
X-url: http://alpage.inria.fr
X-url: http://www.jobingenieur.com/Ingenieur-en-traitement
X-url: http://alpage.inria.fr/~clerger


Offre d'emploi : ingénieur expert - Projet ANR MDCA Passage

Titre: Gestion de corpus annotés en syntaxe

Dans le cadre du projet ANR Passage (Produire des Annotations
Syntaxiques À Grande Échelle -- http://atoll.inria.fr/passage),
l'équipe ALPAGE (INRIA Rocquencourt et Paris 7 --
http://alpage.inria.fr) recherche un ingénieur pour un contrat à durée
déterminée de 12 mois.

S'inscrivant dans le domaine du Traitement Automatique des Langues
(TAL), le projet Passage vise à utiliser plusieurs chaînes de
traitement syntaxique pour produire des annotations syntaxiques sur un
corpus d'au moins 100 millions de mots, pour combiner ces annotations
à l'aide de techniques de vote par majorité (ROVER) et pour utiliser
ces annotations combinées pour des tâches d'acquisition de
connaissances lexicales.

Mission:

	 La mission principale consiste à compléter le développement
	 de EasyRef, un outil WEB 2.0 de gestion d'annotations
	 syntaxiques développé dans le cadre de Passage
	 (fonctionnalités existantes: visualisation, comparaison,
	 édition, rapports de bugs, mini langage de requêtes, ...). À
	 terme, EasyRef doit permettre aux participants d'accéder aux
	 corpus, de déposer leurs annotations et de pouvoir exploiter
	 celles-ci (visualisation, recherche, évaluation).

	 Un défi important concerne le passage à l'échelle de EasyRef
	 pour permettre la gestion d'une dizaine de jeux d'annotations
	 sur 100 millions de mots, en s'appuyant sur des technologies
	 efficaces de bases de données (relationnelles et/ou XML).

	 Un effort de développement doit aussi être mené sur un
	 langage de requêtes plus puissant et efficace que celui
	 existant, pour des requêtes interactives mais aussi en mode
	 batch.

	 Enfin, au travers de l'outil EasyRef et du langage de
	 requêtes, le candidat sera amené à interagir sur les tâches
	 d'acquisition de connaissances à partir d'annotations
	 syntaxiques.

	 D'autre part, le candidat pourra être amené à participer à
	 des tâches de nettoyage des corpus, au fur et à mesure de
	 l'identification de problèmes dans ceux-ci.

Compétences souhaitées:
	
	    * Gestion de corpus linguistiques annotés (si possible en
              syntaxe)
	    * Perl (EasyRef est en Perl/Catalyst)
	    * Bases de données (relationnelles et si possible XML)
	    * Technologies XML
	    * Technologies WEB 2.0 (HTML, javascript, Services WEB)

Informations pratiques

     Adresse : INRIA Rocquencourt
     Type et durée :  CDD 12 mois
     Début : au plus tard Janvier 2009
     Lien: http://www.jobingenieur.com/Ingenieur-en-traitement


Merci d'adresser votre dossier de candidature (lettre de motivation +
cv) à
    Eric de la Clergerie <Eric.De_La_Clergerie at inria.fr>
ou au travers de http://www.jobingenieur.com/Ingenieur-en-traitement

-- 
Eric.De_La_Clergerie at inria.fr	 Equipe Alpage - INRIA Rocquencourt
WWW Home Page: http://alpage.inria.fr/~clerger

-------------------------------------------------------------------------
Message diffuse par la liste Langage Naturel <LN at cines.fr>
Informations, abonnement : http://www.atala.org/article.php3?id_article=48
English version       : 
Archives                 : http://listserv.linguistlist.org/archives/ln.html
                                http://liste.cines.fr/info/ln

La liste LN est parrainee par l'ATALA (Association pour le Traitement
Automatique des Langues)
Information et adhesion  : http://www.atala.org/
-------------------------------------------------------------------------



More information about the Ln mailing list