Job: CDD 1 an, annotation automatique de texte formate, CEA

Thierry Hamon thierry.hamon at UNIV-PARIS13.FR
Tue Sep 15 19:37:01 UTC 2009


Date: Tue, 15 Sep 2009 11:34:53 +0200
From: "CANET Geraud 200968" <geraud.canet at cea.fr>
Message-ID: <E0CF33D771D66246958DE5CA834A4D2505C1DB9B at LaBeaujoire.intra.cea.fr>


Proposition d'emploi pour une durée d'un an.

 

Lieu : centre CEA de Fontenay-aux-Roses

 

Thème : annotation automatique de texte formaté

 

But : réalisation d'un composant permettant d'identifier la structure
dans des textes du type e-mails, dépêches d'agence ou contribution à
des forums, etc.  Il s'agit d'identifier des éléments de type auteur,
date, d'isoler le contenu et de produire une version annotée du texte
dans un format type XML.

Le moteur développé sera paramétrable au moyen d'un formalisme donné,
compatible avec une approche multilingue.

On s'appuiera sur un existant présent dans le laboratoire (plate forme
de traitement linguistique, automates à base de règles). Un corpus
déjà annoté sera fourni pour référence. L'environnement de
développement est à priori C++ sous LINUX. On appréciera les
compétences du candidat en traitement automatique des langues et en
techniques d'apprentissage.

 

Géraud Canet
CEA List
+33 1 46 54 82 69
+33 6 59 24 36 43

-------------------------------------------------------------------------
Message diffuse par la liste Langage Naturel <LN at cines.fr>
Informations, abonnement : http://www.atala.org/article.php3?id_article=48
English version       : 
Archives                 : http://listserv.linguistlist.org/archives/ln.html
                                http://liste.cines.fr/info/ln

La liste LN est parrainee par l'ATALA (Association pour le Traitement
Automatique des Langues)
Information et adhesion  : http://www.atala.org/
-------------------------------------------------------------------------



More information about the Ln mailing list