Job: Ingenieur R&D en traitement automatique de l'information chimique

Thierry Hamon thierry.hamon at LIPN.UNIV-PARIS13.FR
Fri Jun 27 12:49:38 UTC 2008


Date: Wed, 25 Jun 2008 12:11:31 +0200
From: Thibault ROY <roy.thibault at wanadoo.fr>
Message-Id: <8A8A8FC0-C534-490B-A26B-9A4B97984EDC at wanadoo.fr>

Proposition de poste : Ingénieur Recherche et Développement en
traitement automatique de l'information chimique
Société TecKnowMetrix (38)

TecKnowMetrix est une jeune société innovante issue de l'université
Pierre Mendès France et de l'INRA basée sur Voiron, à proximité de
Grenoble. Elle conçoit et développe des méthodes et des outils
d'analyse de l'information scientifique et technologique. De telles
informations sont par exemple contenues dans des bases de données de
brevets et publications, ainsi que sur différents documents issus de
la Toile. L'objectif de TecKnowMetrix est de délivrer une vision
synthétique, une cartographie, d'un environnement technologique
complexe. Cette cartographie est destinée à des dirigeants
d'entreprises, des responsables de R&D, des chercheurs, des
investisseurs ou encore des élus de collectivités locales et elle est
utile au pilotage de projets de recherche des laboratoires publics ou
des groupes industriels innovants.

L'obejctif de ce poste est de répondre à un besoin que nous avons en
matière traitement de documents prenant place dans le domaine de la
chimie et de la biologie. De tels documents contiennent des
informations de différents types – schémas, dessins, formules
chimiques, noms – désignant de mêmes molécules, faisant référence à de
mêmes familles de molécules, etc. Cette grande diversité de
l’information complique fortement son traitement et les analyses que
nous souhaitons en faire.

L'ingénieur intégrera l'équipe TKM et travaillera plus
particulièrement avec les deux membres de l'équipe chargée de la R&D.
Sous la responsabilité du directeur R&D, il devra prendre en charge
les activités de recherche et développement en rapport à la gestion, à
l'accès et à l’extraction de l’information chimique et biologique
présentes dans la base de connaissances TecKnowMetrix.  Cette base
regroupe et organise des dizaines de milliers d'entités, que cela soit
des documents (brevets, publications scientiques, etc.), des
organisations, des individus, des colloques, des projets de recherche,
etc. Elle s'accroît chaque jour. L'objectif de ce poste consiste donc
à travailler à l'évolution des solutions logicielles afin de garantir
l'optimisation de l'usage de cette base de connaissances en matière du
traitement de l’information chimique et biologique.

Trois principaux axes de travail devront être abordés durant ce
travail :

- Identification des molécules et de leurs interactions dans les
  textes : Isoler dans des textes (essentiellement brevets et
  publications) des noms de molécules et mettre en évidence des
  interactions entre entités.

- Regroupement de graphies différentes désignant des molécules
  identiques ou des molécules / plantes appartenant à de mêmes
  familles : Catégoriser des graphies différentes avec dans des
  ensembles désignant des molécules identiques ou appartenant à des
  mêmes familles de molécules.

- Analyse de formules chimiques et de dessins afin d’identifier les
  molécules désignées : Extraire à partir de formules chimiques et de
  dessins de molécules, les noms associés afin de mettre en commun des
  informations présentes dans les parties textuelles, les formules et
  les images des documents étudiés.

L’objectif de ce poste consiste à avoir regard transversal sur les
technologies liées aux axes de recherche et développement précédents.
Si de telles technologies existent et sont jugées pertinentes, elles
devront être adaptées et mises en place dans la plate-forme
TecKnowMetrix. Si ce n’est pas le cas, de nouvelles méthodes de
traitement de l’information chimique devront être élaborées,
expérimentés sur les données de notre base de connaissances et
implémentées dans notre plate-forme.

Le profil recherché serait idéalement un jeune docteur ayant de fortes
compétences en traitement automatique des langues et en chimie.

Envoyer votre candidature (CV et lettre de motivation) par mail à :
Thibault ROY - Directeur Recherche et Développement TecKnowMetrix - tr at tkm.fr


-------------------------------------------------------------------------
Message diffuse par la liste Langage Naturel <LN at cines.fr>
Informations, abonnement : http://www.atala.org/article.php3?id_article=48
English version       : 
Archives                 : http://listserv.linguistlist.org/archives/ln.html
                                http://liste.cines.fr/info/ln

La liste LN est parrainee par l'ATALA (Association pour le Traitement
Automatique des Langues)
Information et adhesion  : http://www.atala.org/
-------------------------------------------------------------------------



More information about the Ln mailing list