Job: Stage de Master 1 au LIMSI, Traitement Automatique des Langues

Thierry Hamon thierry.hamon at UNIV-PARIS13.FR
Wed Feb 1 11:27:15 UTC 2012


Date: Tue, 31 Jan 2012 15:11:28 +0100
From: Xavier Tannier <xtannier at limsi.fr>
Message-ID: <4F27F690.7070503 at limsi.fr>
X-url: http://www.limsi.fr/~xtannier/fr/Stages/sujet_2012_M1_phrase_saillante.html

Offre de stage de Master 1 à Orsay (91), au LIMSI.
http://www.limsi.fr/~xtannier/fr/Stages/sujet_2012_M1_phrase_saillante.html


  Sélection automatique de passage représentatif d'un événement


      Mots-clés

/traitement automatique de la langue, analyse temporelle, événements/


    Contexte

Entre autres objectifs, le projet ANR ChronoLines a pour but de créer de
façon semi-automatique des chronologies à partir de dépêches d'agences.
Étant donnés un thème fourni par l'utilisateur et un ensemble de textes,
il s'agit de retrouver dans les documents les événements les plus
importants concernant ce thème, puis de les ordonner et de les présenter
à l'utilisateur pour validation. Par exemple, pour une demande sur un
nom de personne, le système devra retracer les événements marquants de
sa vie. Pour les négociations de paix au Moyen-Orient, les principales
dates importantes s'y rattachant.

Parmi les étapes nécessaires pour atteindre ce résultat, une phase
consiste à sélectionner, parmi les événements détectés, ceux qui
semblent les plus marquants, ou les plus centraux, par rapport au thème
de la requête. Pour chacun de ces événements, il faut ensuite choisir un
texte caractéristique, expliquant de façon claire et concise de quoi il
s'agit. Ce passage de texte est à choisir parmi un ensemble de
nombreuses phrases décrivant l'événement.


    Travail à réaliser :

Durant ce stage, on partira d'un système existant. Ce système
sélectionne les phrases qui correspondent, de façon plus ou moins
précise, à chaque événement à insérer dans la chronologie. L'objectif du
stage est de :

  * Parcourir la littérature scientifique sur le sujet (sélection de
    texte, résumé automatique, agrégation de résultats, etc.) pour
    identifier les techniques existantes susceptibles d'être adapter à
    notre problème.
  * Réaliser un outil permettant de choisir (ou éventuellement de
    générer) une phrase explicative d'un événement, à partir d'un
    ensemble de courts textes à son sujet.

Le stagiaire devra avoir de bonnes compétences en informatique et un 
intérêt pour les problématiques du traitement de la langue.

*Durée* : environ 2 mois
*Niveau* : Master 1


      Contacts :

Veronique.Moriceau[at]limsi.fr
Xavier.Tannier[at]limsi.fr

-------------------------------------------------------------------------
Message diffuse par la liste Langage Naturel <LN at cines.fr>
Informations, abonnement : http://www.atala.org/article.php3?id_article=48
English version       : 
Archives                 : http://listserv.linguistlist.org/archives/ln.html
                                http://liste.cines.fr/info/ln

La liste LN est parrainee par l'ATALA (Association pour le Traitement
Automatique des Langues)
Information et adhesion  : http://www.atala.org/
-------------------------------------------------------------------------



More information about the Ln mailing list