Job: Stages de M1 et M2, systemes de question-reponse, LIMSI-CNRS, Orsay

Thierry Hamon thierry.hamon at UNIV-PARIS13.FR
Sat Jan 16 11:51:37 UTC 2010


Date: Thu, 14 Jan 2010 08:38:23 +0100
From: Xavier Tannier <Xavier.Tannier at limsi.fr>
Message-ID: <4B4EC9EF.3010201 at limsi.fr>
X-url: http://www.limsi.fr/Individu/xtannier/fr/Stages/sujet_M2R_contexte_analyse.html
X-url: http://www.limsi.fr/Individu/xtannier/fr/Stages/sujet_M2R_contexte_questions_complexes.html
X-url: http://sites.google.com/site/delphinebernhard/proposition-de-stage-generation-questions
X-url: http://www.ensiie.fr/~bg/stage_fouilleDeTexte.html
X-url: http://www.limsi.fr/Individu/xtannier/fr/Stages/sujet_M1_confiance_question_reponse.html
X-url: http://www.limsi.fr/Scientifique/iles/propositions

L'équipe ILES du LIMSI propose cette année *quatre stages de M2
(master recherche ou master professionnel)* dans le domaine des
systèmes de questions-réponses, ainsi qu'*un stage de M1*.

Un résumé de ces stages est présenté ci-dessous, une description plus
complète est disponible aux adresses suivantes :
Stages de M2 :
http://www.limsi.fr/Individu/xtannier/fr/Stages/sujet_M2R_contexte_analyse.html
http://www.limsi.fr/Individu/xtannier/fr/Stages/sujet_M2R_contexte_questions_complexes.html
http://sites.google.com/site/delphinebernhard/proposition-de-stage-generation-questions
http://www.ensiie.fr/~bg/stage_fouilleDeTexte.html

Stage de M1 :
http://www.limsi.fr/Individu/xtannier/fr/Stages/sujet_M1_confiance_question_reponse.html

Par ailleurs, d'autres stages dans d'autres thèmes sont proposés par 
l'équipe :
http://www.limsi.fr/Scientifique/iles/propositions

___________

*Stage de M2 : Sélection de passages pour répondre à des questions
complexes *

FIDJI est un système de questions-réponses pour le français et
l'anglais qui traite des questions factuelles et complexes, en
combinant des informations d'ordre syntaxique et des techniques
"classiques" du domaine, telles que la reconnaissance des entités
nommées et la pondération des termes de la question.

Pour mieux répondre aux questions complexes ("pourquoi", "comment",
opinion), une approche serait d'étudier les passages sélectionnés par
le système à partir des mots-clés de la question et d'identifier s'il
s'agit de textes susceptibles d'apporter la réponse à une question
"pourquoi" ou "comment".

Par exemple, pour la question complexe "Pourquoi le ciel est-il bleu
?", le moteur de recherche renvoie les passages suivants :
"le bleu du ciel est le résultat de la diffusion de la lumière solaire
par les composants de l'atmosphère."

"et si le ciel est bleu, c'est à cause de la diffusion de Rayleigh qui
est la plus importante dans le bleu (ondes électromagnétiques).  "

http://www.limsi.fr/Individu/xtannier/fr/Stages/sujet_M2R_contexte_questions_complexes.html

Contacts :
Véronique Moriceau (moriceau at limsi.fr)
Xavier Tannier (xtannier at limsi.fr)

___________

*Stage de M2 : Définition d'un contexte d'analyse des documents pour
les systèmes de questions-réponses *


Dans le domaine de la recherche d'information précise
(question-réponse), la recherche d'un passage contenant
potentiellement la bonne réponse est une étape cruciale du processus.
La plupart des systèmes actuels utilisent une taille fixe de passages.

Le but du stage est d'améliorer la sélection de passages contenant la
réponse à des questions.

Le stage a une durée de 4 mois prolongeable à 6.
http://www.limsi.fr/Individu/xtannier/fr/Stages/sujet_M2R_contexte_analyse.html

Contacts :
Véronique Moriceau (moriceau at limsi.fr)
Xavier Tannier (xtannier at limsi.fr)


___________

*Stage de M2 : Génération automatique de questions à partir de
paragraphes *

*La génération de questions consiste à produire automatiquement des
questions à partir d'un texte donné pour diverses applications :
création de tests et de questionnaires à choix multiples, systèmes de
dialogue homme-machine ou de questions-réponses interactifs.

Par exemple, il est possible de générer plusieurs questions à partir
du paragraphe suivant :

Barack Obama, né le 4 août 1961 à Honolulu, dans l'État d'Hawaï, est
le 44e et actuel président des États-Unis d'Amérique.  Le 9 octobre
2009, il reçoit le prix Nobel de la paix.

       1.  Qui est l'actuel président des États-Unis d'Amérique ?
       2.  Où est né Barack Obama ?
       3.  Quelle est la date de naissance de Barack Obama ?
       4.  Quel président des États-Unis d'Amérique a obtenu le prix
           Nobel de la paix en 2009 ?

L'objectif du stage sera de développer un système capable de générer
automatiquement des questions en anglais à partir d'un paragraphe de
texte donné.  La génération sera réalisée à l'aide de règles de
transformation de phrases déclaratives en phrases interrogatives se
basant sur une analyse syntaxique préalable du texte considéré.  On
s'attachera également à la génération de questions à partir d'éléments
d'information distribués dans plusieurs phrases.

http://sites.google.com/site/delphinebernhard/proposition-de-stage-generation-questions

Contacts :
Delphine Bernhard (delphine.bernhard at limsi.fr)
Véronique Moriceau (moriceau at limsi.fr)
Xavier Tannier (xtannier at limsi.fr)

___________

*Stage de M2 : Mise en évidence et utilisation de relations entre
entités nommées pour la fouille de texte et la recherche
d'informations précises *


Dans le cadre de recherche d'informations sur les participants à des
événements (avec qui ces personnes sont en relation, où se
trouvent-elles, quel type de participation ont-elles eu à d'autres
événements connexes ou de même nature), se pose le problème de la
reconnaissance de ce type d'information dans des textes, de leur
représentation, de la manière de les interroger et de la manière de
présenter les réponses.

Ce stage portera plus particulièrement sur la définition du mode
d'interrogation d'une base de textes à partir d'une question en langue
naturelle. Il s'agira de déterminer automatiquement à quel type de
demande on a affaire, en s'appuyant sur des technologies développées
dans le cadre de Question-réponse, et de modéliser l'interrogation de
textes pour y retrouver des relations. Ce dernier aspect rejoint la
problématique plus générale des moteur de recherche verticaux (dédiés
à un domaine, à certains types de requêtes et pouvant travailler sur
des informations structurées ou semi-structurées).

http://www.ensiie.fr/~bg/stage_fouilleDeTexte.html

Contact :
Brigitte Grau (bg at limsi.fr)

___________

*Stage de M1 : Estimation de la confiance accordée à une réponse dans un 
système de question-réponse*

Les systèmes de question-réponse ont pour but d'apporter une réponse
précise à une question posée en langage naturel. Par exemple, à la
question "/À quelle date est mort Henri IV ?/", la réponse retournée
doit être "/1610/" (et non pas des pages contenant la réponse, comme
c'est le cas des moteurs de recherche classiques).

Les systèmes créés dans ce cadre ont une architecture qui comprend
toujours, entre autres, un module d'analyse de la question posée et un
module d'extraction de la réponse finale.

FIDJI est un système de questions-réponses pour le français et
l'anglais, combinant des informations d'ordre syntaxique et des
techniques "classiques" du domaine, telles que la reconnaissance des
entités nommées et la pondération des termes de la question.

Dans le système FIDJI, les réponses extraites par le système sont
ordonnées selon la combinaison d'un certain nombre de critères (forme
syntaxique de la phrase réponse, vérification du type de la réponse,
fréquence de la réponse dans les textes, etc.), et les 3 meilleures
réponses sont retournées à l'utilisateur.

Le but est de définir à partir de cet ensemble de critères un score de
confiance entre 0 et 1 qui permette à l'utilisateur de savoir à quel
point il peut se fier à la réponse fournie (simulation d'une
probabilité de pertinence de la réponse).

http://www.limsi.fr/Individu/xtannier/fr/Stages/sujet_M1_confiance_question_reponse.html

Contacts :
Véronique Moriceau (moriceau at limsi.fr)
Xavier Tannier (xtannier at limsi.fr)


-------------------------------------------------------------------------
Message diffuse par la liste Langage Naturel <LN at cines.fr>
Informations, abonnement : http://www.atala.org/article.php3?id_article=48
English version       : 
Archives                 : http://listserv.linguistlist.org/archives/ln.html
                                http://liste.cines.fr/info/ln

La liste LN est parrainee par l'ATALA (Association pour le Traitement
Automatique des Langues)
Information et adhesion  : http://www.atala.org/
-------------------------------------------------------------------------



More information about the Ln mailing list