Job: Emploi CDD IE recherche informatique INRA
Thierry Hamon
thierry.hamon at UNIV-PARIS13.FR
Tue Oct 19 20:20:57 UTC 2010
Date: Tue, 19 Oct 2010 11:02:36 +0200
From: Claire Nedellec <Claire.Nedellec at jouy.inra.fr>
Message-ID: <20101019110236.15646eunnxr1pzsw at www2.jouy.inra.fr>
X-url: http://genome.jouy.inra.fr/bibliome
CDD 1 ans, ingénieur d'étude,
projet de recherche FSOV SAM à MIG (INRA).
Centre de recherche de Jouy-en-Josas (région parisienne)
-----------------------------------
Mots-clefs : extraction d’information, apprentissage automatique,
TALN, biologie moléculaire.
Contexte :
-------------
L'emploi concerne l'extraction d'information, d'entités nommées et de
relations à partir d'articles scientifiques, pour le projet de
recherche FSOV (Fond de soutien à l'obtention végétale) intitulé SAM
(Sélection assistée du blé tendre par marqueur génétique).
L'équipe Bibliome de l'unité INRA Mathématiques, Informatique et
Génome (MIG) développe des méthodes de recherche et d’extraction
d’information dans la littérature scientifique et technique, basées
sur l’acquisition automatique de connaissances à partir de corpus
(entités nommées, terminologies, ontologies). L’activité de recherche
de l’unité MIG est pluridisciplinaire (math-info, biologie),
fondamentale et appliquée.
Mission :
------------
Il s'agira de développer et d'adapter les méthodes d’acquisition de
règles d’extraction de connaissances sémantiques à partir de corpus
d'articles en langage naturel et de contribuer à leur intégration dans
la plateforme de traitement Alvis. Les entités nommées à reconnaître
sont principalement des caractères (résistance aux maladies), et des
noms de variété de blé, de gènes et de marqueurs. L’approche
privilégiée par l’équipe est basée sur la normalisation automatique
des corpus d’apprentissage grâce à une analyse linguistique profonde
(par ex. terminologie, catégories sémantiques).
Ces activités seront conduites en collaboration étroite avec les
biologistes du projet (unité UMR INRA Génétique, Diversité et
Ecophysiologie des Céréales), Arvalis et UFS, qui spécifient les
connaissances à extraire, annoteront les exemples d'apprentissage et
valideront et exploiteront les résultats de l'extraction.
Profil :
---------
Master ou diplôme d'ingénieur en informatique ou bioinformatique.
Spécialisation en TAL ou apprentissage automatique.
Bonnes compétences en ingénierie informatique. Capacité à développer
et intégrer des outils d’IA.
Maîtrise et expérience d’au moins deux langages de programmation parmi
C, C++, Perl et Java.
Des connaissance des technologies Web (RDF, OWL, XSLT) et bases de
données (PostgreSQL) sont un plus.
Intérêt pour la biologie.
Poste :
--------
Contrat à durée déterminée au niveau Ingénieur d'étude de 1 ans à
partir du 1er décembre 2010, éventuellement prolongeable. La
rémunération est de 1 917 euros brut par mois.
Le poste est localisé au centre de recherche de l'INRA à Jouy-en-Josas
dans les locaux de l'unité MIG. Un logement sur place pourra être
attribué pour quelques mois.
Dossier :
----------
- Un CV détaillé incluant la description de la participation
éventuelle du candidat à des projets de recherche institutionnels et
à des développements informatiques.
- Travaux personnels (Article, Mémoire)
- Notes de Master ou école
Contacts :
-----------
Claire Nédellec (resp. d'équipe) : Claire.Nedellec at jouy.inra.fr
Robert Bossy (chef de projet) : Robert.Bossy at jouy.inra.fr
URL de l'équipe : http://genome.jouy.inra.fr/bibliome
URL de l’unité : http://mig.jouy.inra.fr
-------------------------------------------------------------------------
Message diffuse par la liste Langage Naturel <LN at cines.fr>
Informations, abonnement : http://www.atala.org/article.php3?id_article=48
English version :
Archives : http://listserv.linguistlist.org/archives/ln.html
http://liste.cines.fr/info/ln
La liste LN est parrainee par l'ATALA (Association pour le Traitement
Automatique des Langues)
Information et adhesion : http://www.atala.org/
-------------------------------------------------------------------------
More information about the Ln
mailing list