These: Guillaume Bernard, Reordonnancement d'hypotheses dans un systeme de questions-reponses

Fri May 27 20:18:47 UTC 2011

Date: Wed, 25 May 2011 14:31:39 +0200
From: Guillaume Bernard <gbernard at limsi.fr>
Message-ID: <4DDCF6AB.2020401 at limsi.fr>

Bonjour,

J'ai le plaisir de vous inviter à ma soutenance de thèse intitulée
"Réordonnancement d'hypothèses dans un système de questions-réponses"
ainsi qu'au pot qui suivra la soutenance.

La soutenance se déroulera le lundi 6 Juin à 14h00 dans la salle de
conférence du LIMSI, Université Paris Sud 11 (Bât 508, rue Louis De
Broglie, Campus de l'université, Orsay).

Le jury sera composé de :

M. Patrice Bellot, LIA et Université d'Avignon (Rapporteur)

M. Kamel Smaili, LORIA et Université Nancy 2 (Rapporteur)

M. Frédéric Béchet, LIF et Université de la Méditerranée (Examinateur)

Mme Jeanne Villaneau, VALORIA et Université de Bretagne Sud (Examinateur)

M. Pierre Zweigenbaum, LIMSI-CNRS (Examinateur)

Mme Martine Adda-Decker, LIMSI-CNRS, LPP (Directrice)

Mme Sophie Rosset, LIMSI-CNRS (Directrice)

Résumé de la thèse :

L’objectif de cette thèse a été de proposer une approche robuste pour
traiter le problème de la recherche de la réponse précise à une
question.

Notre première contribution a été la conception et la mise en oeuvre
d’un modèle de représentation robuste de l’information et son
implémentation. Son objectif est d’apporter aux phrases des documents
et aux questions de l’information structurelle, composée de groupes de
mots typés (segments typés) et de relations entre ces groupes. Ce
modèle a été évalué sur différents corpus (écrits, oraux, web) et a
donné de bons résultats, prouvant sa robustesse.

Notre seconde contribution a consisté en la conception d’une méthode
de réordonnancement des candidats réponses retournés par un système de
questions-réponses. Cette méthode a aussi été conçue pour des besoins
de robustesse, et s’appuie sur notre première contribution. L’idée est
de comparer une question et le passage d’où a été extraite une réponse
candidate, et de calculer un score de similarité, en s’appuyant
notamment sur une distance d’édition.

Le réordonnanceur a été évalué sur les données de différentes
campagnes d’évaluation. Les résultats obtenus sont particulièrement
positifs sur des questions longues et complexes. Ces résultats
prouvent l’intérêt de notre méthode, notre approche étant
particulièrement adaptée pour traiter les questions longues, et ce
quel que soit le type de données. Le réordonnanceur a ainsi été évalué
sur l’édition 2010 de la campagne d’évaluation Quaero, où les
résultats sont positifs.

Abstract:

The objective of this work is to introduce a new robust approach to
treat the problem of finding the correct answer to a question.

Our first contribution is the design and implementation of a robust
representation model for information. The aim is to represent the
structural information of sentences of documents and questions
structural information. This representation is composed of typed
groups of words (typed segments) and relations between these
groups. This model has been evaluated on several corpus (written,
oral, web) and achieved good resultats, which proves his robustness.

Our second contribution consisted is the design of a re-ranking method
of a set of the candidate answers output by the question-answering
system. This re-ranking method is based on the structural information
representation. The general idea is to compare a question and a
passage from where a candidate answer was extracted, and to compute a
similarity score by using a modified edit distance we proposed.

Our re-ranking method has been evaluated on the data of several
evaluation campaigns. The results are quite good on long and complex
questions. These results show the interest of our method : our
approach is quite adapted to treat long question, whatever the type of
the data. The re-ranker has been officially evaluated on the 2010
edition of the Quaero evaluation campaign, with positives results.

Guillaume Bernard

-------------------------------------------------------------------------
Message diffuse par la liste Langage Naturel <LN at cines.fr>
Informations, abonnement : http://www.atala.org/article.php3?id_article=48
English version       : 
Archives                 : http://listserv.linguistlist.org/archives/ln.html
                                http://liste.cines.fr/info/ln

La liste LN est parrainee par l'ATALA (Association pour le Traitement
Automatique des Langues)
Information et adhesion  : http://www.atala.org/
-------------------------------------------------------------------------