Job: Stage, Definition d'un champ lexical propre a l'Epidemiologie Clinique, LRI, Orsay

Thierry Hamon thierry.hamon at LIPN.UNIV-PARIS13.FR
Sat Mar 14 08:33:03 UTC 2009


Date: Tue, 10 Mar 2009 21:43:55 +0100
From: Jérôme Azé <Jerome.Aze at lri.fr>
Message-ID: <49B6D10B.9070507 at lri.fr>
X-url: http://www.lri.fr/~heitz/formulaire_logiciels.html


Fiche de stage :
Proposition de stage de Master 1 ou 2 bioinformatique, 2009, LRI, 
Université Paris-Sud 11, Orsay :
Définition d'un champ lexical propre à l'Epidémiologie Clinique à
partir des articles publiés dans 'Journal of Clinical Epidemiology'

Equipe d'accueil: Equipe Bioinformatique (LRI, Orsay), Unité INSERM
CIC-EC4 (Hôpital Européen G. Pompidou, AP-HP, Paris), équipe TAL
(LIRMM, Montpellier), Unité Inserm UMRS 872 éq 20 (SPIM, Paris).

Responsable de stage : Jérôme Azé (LRI) et Ludovic Trinquart (INSERM
CIC-EC4)

Durée souhaitée : 4 à 6 mois

Le stage est susceptible d'être rémunéré (cofinancement par les deux
structures).

Compétences
Compétence Informatique et Biologie : connaissance d'un langage de
programmation (idéalement Perl).

Environnement
Le stagiaire travaillera au sein de l'équipe Bioinformatique du LRI 
(Univ Paris-Sud 11, Orsay). Le stage se déroulera en étroite 
collaboration avec l'Unité INSERM de l'HEGP.

Contexte
L'épidémiologie clinique est une discipline qui utilise les informations 
épidémiologiques recueillies auprès de groupes de malades pour une 
meilleure prise de décision clinique face à un malade donné.
L'objectif du stage est de cerner, par des méthodes de fouille de texte, 
l'objet et les méthodes de l'Epidémiologie Clinique.  

Objectif du stage
Le stage ne suppose pas de pré-requis en Epidémiologie Clinique (EC).
Le principal objectif du stage consiste à faire émerger les
thématiques de recherche centrales pour l'EC et leurs relations avec
les méthodes scientifiques, notamment dans le cadre du journal
relevant de l'EC : Journal of Clinical Epidemiology (JCE). Les
articles publiés dans le JCE entre 1995 et 2008 inclus sont
disponibles et constitueront le corpus d'études.
Ces articles complets sont disponibles au format pdf, tandis qu'une
fiche synthétique de ces références au format xml contient, entre
autre, le résumé et une liste de termes MeSH (terminologie des termes
médicaux : Medical Subject Headings).
Une première approche consistera à étudier les termes MeSH renseignés
dans les fiches xml associées aux articles et ainsi à extraire, sur la
base de ces termes MeSH, un premier vocabulaire du domaine de l'EC.

Dans un second temps, une classification des articles grâce aux termes
MeSH renseignés devra être réalisée afin de fournir un ensemble
d'articles proches du point de vue de l'indexation MeSH.  Les résumés
de ces groupes d'articles pourront alors être analysés plus finement
pour en extraire la terminologie spécifique employée dans les
articles.
Ensuite, la corrélation entre les termes MeSH et la terminologie
extraite des résumés sera étudiée pour fournir le champ lexical
spécifique à l'EC que nous recherchons.

L'extraction de la terminologie pourra être réalisée à l'aide des
outils EXIT et FASTR.

Le langage qui devra être utilisé pour réaliser ce stage est le
langage Perl. Son apprentissage est aisé et abordable à toute personne
ayant déjà la maîtrise d'un autre langage de programmation impérative.


Bibliographie
- Variation terminologique : reconnaissance et acquisition
  automatiques de termes et de leurs variantes en corpus. Jacquemin,
  C.. Mémoire d'habilitation à diriger des recherches en informatique
  fondamentale, Université de Nantes, 1997.

- Expansion of multi-word terms for indexing and retrieval using
  morphology and syntax. Jacquemin, C., Klavans, J. L., and
  Tzoukermann, E.  In Proceedings 35th Annual Meeting of the
  Association for Computational Linguistics and 8th Conference of the
  European Chapter of the Association for Computational Linguistics
  (ACL - EACL'97), Madrid, 1997.

- EXIT: Un système itératif pour l'extraction de la terminologie du
  domaine à partir de corpus spécialisés. Roche M., Heitz T.,
  Matte-Tailliez O., Kodratoff Y. Actes des JADT'04 (Journées
  internationales d'Analyse statistique des Données Textuelles),
  Volume 2, p946-956, mars 2004, Louvain-la-Neuve, Belgique, 2004.
  Téléchargement du Logiciel EXIT :
  http://www.lri.fr/~heitz/formulaire_logiciels.html

-------------------------------------------------------------------------
Message diffuse par la liste Langage Naturel <LN at cines.fr>
Informations, abonnement : http://www.atala.org/article.php3?id_article=48
English version       : 
Archives                 : http://listserv.linguistlist.org/archives/ln.html
                                http://liste.cines.fr/info/ln

La liste LN est parrainee par l'ATALA (Association pour le Traitement
Automatique des Langues)
Information et adhesion  : http://www.atala.org/
-------------------------------------------------------------------------



More information about the Ln mailing list