Job: Offre de stage post-doctoral, Synthese de document

Thierry Hamon thierry.hamon at LIPN.UNIV-PARIS13.FR
Fri Jul 13 16:01:19 UTC 2007


Date: Thu, 12 Jul 2007 11:22:56 +0200
From: Ga‘l de Chalendar <Gael.de-Chalendar at cea.fr>
Message-Id: <200707121122.56990.Gael.de-Chalendar at cea.fr>


[Veuillez m'excuser pour les envois multiples]

Le CEA-LIST et l'IRSN proposent un stage post-doctoral d'un an
consacrŽ au dŽveloppement dÕun logiciel de gŽnŽration de synthses de
documents reflŽtant la ÇÊposition de lÕauteurÊÈ, par extraction des
ÇÊtraits les plus caractŽristiquesÊÈ du texte.

L'IRSN a exprimŽ le besoin d'un outil permettant de gŽnŽrer une
synthse pour cerner le contenu informatif essentiel dÕun document
scientifique ou technique volumineux (aide ˆ la dŽcision de lecture,
aide ˆ la rŽdaction de rŽsumŽs, etc.). La synthse doit tre courte (1
ˆ 2 pages) et rŽalisable sur des documents Žcrits en franais ou en
anglais. Les logiciels actuellement disponibles ne rŽpondent pas ˆ ces
besoins. CÕest pourquoi il est proposŽ de rŽaliser un dŽveloppement
spŽcifique en utilisant les outils linguistiques disponibles au
CEA-LIST et en profitant des compŽtences et de lÕexpŽrience dŽjˆ
acquise par le LIC2M dans le domaine.

Ë l'issue du projet Eureka Morcas, le CEA-LIST dispose d'un ensemble
de briques de base permettant de construire divers types de systmes
de rŽsumŽ automatique orientŽs ÇÊauteurÊÈ (monolingue par extraction
et par gŽnŽration, translingue par extraction et par
gŽnŽration). L'objectif du stage post-doctoral consiste ˆ complŽter
l'Žvaluation des modules dŽveloppŽs au cours de Morcas et de les
complŽter par une recherche des expressions caractŽristiques de
l'argumentation de l'auteur, fondŽe sur un outil d'extraction ˆ base
de patrons. L'application rŽsultante permettra d'extraire les phrases
thŽmatiquement importantes des documents, associŽes aux structures
discursives les plus importantes.

La durŽe du stage est prŽvue pour un an ˆ partir du 01/09/07,
Žventuellement renouvelable une fois. Le stage post-doctoral sera
rŽalisŽ dans les locaux de la DICST (responsableÊ: H. Pitsch) et dans
ceux du LIC2M sous la direction de G. de Chalendar. Les deux sites
sont situŽs ˆ Fontenay-aux-Roses, prs de Paris.

Le ou la candidate devra tre titulaire d'un doctorat en informatique
dans le domaine du traitement automatique des langues. Une
connaissance des technique de rŽsumŽ automatique ou d'extraction
d'information serait un plus.

Contacts
CEA/LIST/DTSI/SRCI/LIC2MÊ: G. de Chalendar (mailto:Gael.de-Chalendar at cea.fr)
IRSN/DESTQ/DICSTÊ: H. Pitsch (mailto:helmut.pitsch at irsn.fr)

-- 
Gael de Chalendar
CEA-LIST
Centre de Fontenay-aux-Roses
Laboratoire d'IngŽnierie de la Connaissance MultimŽdia Multilingue (LIC2M)
(Multimedia and Multilingual Knowledge Engineering Laboratory)
Bat. 38-2 ; 18, rue du Panorama ; BP 6
92265 Fontenay aux Roses Cedex ; France
TŽl.:01.46.54.80.18 ; Fax.:01.46.54.75.80
Email : Gael.D.O.T.de-Chalendar.A at T.cea.D.O.T.fr



-------------------------------------------------------------------------
Message diffuse par la liste Langage Naturel <LN at cines.fr>
Informations, abonnement : http://www.atala.org/article.php3?id_article=48
English version       : 
Archives                 : http://listserv.linguistlist.org/archives/ln.html
                                http://liste.cines.fr/info/ln

La liste LN est parrainee par l'ATALA (Association pour le Traitement
Automatique des Langues)
Information et adhesion  : http://www.atala.org/
-------------------------------------------------------------------------



More information about the Ln mailing list