Job: Stage, Extraction d'information dans les dossiers patients, IMS Group

Thierry Hamon thierry.hamon at UNIV-PARIS13.FR
Tue Jan 24 20:48:09 UTC 2012


Date: Tue, 24 Jan 2012 21:40:16 +0100
From: Thierry Hamon <thierry.hamon at univ-paris13.fr>
Message-ID: <87y5swzvf3.fsf at smtp.univ-paris13.fr>


Stage rémunéré de traitement automatique de langage naturel (TAL)

1. Cadre général

IMS Health est un partenaire privilégié des plus grands laboratoires
pharmaceutiques mondiaux et une entreprise de référence en matière de
traitement de données de santé/médicament.

Les bases de données des dossiers patients constituent une des forces
incontournables d'IMS. En France, la base Disease Analyzer (TM) contient
plus de 5 millions de patients dont certains suivis depuis l'an
2000. Cette base comporte des informations provenant du dossier
patient des médecins membre d'un panel représentatif et comprend les
diagnostics, les traitements et les caractéristiques des patients. Une
partie des informations est saisie sous forme de texte libre. Cette
partie pourrait contenir des informations d'une grande valeur sur les
résultats d'examens biologiques, orientations diagnostiques, consignes
de traitement ou encore des données sur l'observance
thérapeutique. IMS souhaite mettre en place un outil de traitement de
langage naturel (TAL) permettant le codage et la structuration de ses
données en commençant par les résultats d'examens de laboratoire.

2. Contenu du stage

Les données sont hébergées chez IMS et dans une base SQL
Server. L'objectif est d'examiner un corps de textes courts (quelques
mots à quelques phrases) saisi par les médecins dans les dossiers
patients afin détecter, codifier et structurer les informations
pertinentes: 

Dans un premier temps on cherche à examiner chaque corps de texte dans
le contexte du dossier patient pour comprendre son orientation globale
et pour le classifier selon son thème : examen clinique, imagerie,
données d'observance, décision thérapeutique, justification
diagnostique, etc.

Dans un deuxième un travail exploratoire sera réalisé autour
d'architectures pour le Traitement Automatique de la Langue (UIMA,
GATE, OpenNLP) et en fonction de leur intérêt pour structurer ces
données.

Dans un troisième temps, le stagiaire développera un programme
informatique (en Java) permettant de structurer et codifier au mieux
l'information pour une des catégories (examens laboratoire).

3. Profil

- Etudiant en informatique avec notamment des connaissances en bases
  de données

- Forte motivation, rigueur et esprit d'équipe

- Connaissance du langage médical ou une expérience précédente de TAL
  sera un plus.

4. Localisation et encadrement

Le stagiaire sera encadré par IMS et sera en contact avec un
laboratoire d'informatique médicale (LIM&BIO). D'une durée de 6 mois,
il se déroulera dans les locaux d'IMS (Puteaux, 92). En fonction des
besoins, des déplacements au laboratoire seront possibles.

5-Rémunération

Selon le profil, pouvant aller jusqu'à 1000 euros par mois.

6-Contact

Dr Massoud TOUSSI, MD, PhD
Medical Director, Health Economics & Outcomes Research
IMS Consulting Group
91, rue Jean Jaurès
92800 PUTEAUX
France
Tel: +33 (0)1-41 35 13 35
Fax: +33 (0)1-41 35 13 49
email: mtoussi at imscg.com
http://www.imsconsultinggroup.com

-------------------------------------------------------------------------
Message diffuse par la liste Langage Naturel <LN at cines.fr>
Informations, abonnement : http://www.atala.org/article.php3?id_article=48
English version       : 
Archives                 : http://listserv.linguistlist.org/archives/ln.html
                                http://liste.cines.fr/info/ln

La liste LN est parrainee par l'ATALA (Association pour le Traitement
Automatique des Langues)
Information et adhesion  : http://www.atala.org/
-------------------------------------------------------------------------



More information about the Ln mailing list