Appel: TALN2004: Atelier Questions Reponses

Wed Dec 10 15:58:05 UTC 2003

APPEL A COMMUNICATION

(English version below)
**********************************************************************
Dans le cadre de la conférence T A L N 2 0 0 4

                    Atelier QUESTION-REPONSE
  ---

  Palais de Congrès
  Fès (Maroc)

Le 22 avril 2004

  http://www.lpl.univ-aix.fr/jep-taln04/
**********************************************************************

Les systèmes de recherche d'information à venir se doivent de répondre
à des besoins plus précis que les systèmes existants pour satisfaire
au mieux les utilisateurs. Lorsque l'intérêt de l'utilisateur porte
sur des thèmes particuliers ou sur le suivi de l'évolution d'un
domaine, il est pertinent d'utiliser des systèmes de filtrage et de
résumé. Lorsque ce même utilisateur recherche une donnée factuelle,
l'information pertinente ne peut être apportée que par des systèmes
dédiés à ce type de tâche. En effet, face à une question telle que
«Quelle est la voiture la plus chère du monde ?», les moteurs de
recherche traditionnels renvoient tous les documents jugés pertinents
par rapport à la question, en sélectionnant éventuellement un passage,
et c'est à l'utilisateur que revient la tâche d'explorer ces documents
afin de trouver la réponse à sa question. Répondre à des questions
précises requiert une analyse plus en profondeur des documents
sélectionnés afin d'en extraire l'information pertinente.

La problématique des systèmes de question/réponse se situe ainsi à
l'intersection de plusieurs domaines, dont notamment la recherche
d'information et le traitement de la langue naturelle. La recherche de
documents pertinents est enrichie par l'intégration de modules de TAL
s'appliquant à large échelle, i.e. quel que soit le domaine abordé, et
possédant une grande couverture linguistique. Cette intégration permet
la sélection de passages pertinents en s'appuyant à la fois sur des
critères numériques et sur l'exploitation de traits linguistiques,
qu'ils soient de nature syntaxique ou sémantique. Un troisième domaine
trouve alors aussi naturellement sa place dans cette problématique, à
savoir l'apprentissage automatique, avec l'apprentissage de critères
de sélection et de classification des extraits.

Typiquement, un système de question/réponse s'articule ainsi autour
d'un moteur de recherche traditionnel, enrichi en amont par un module
d'analyse des questions et en aval par des modules robustes d'analyse
des documents assurant l'extraction de passages réponses en mêlant
l'exploitation de traits linguistiques, aussi bien de nature
morphologique, syntaxique ou sémantique, et l'utilisation de critères
numériques, plus classiques en recherche d'information.  En outre, un
système de question réponse se doit aussi de mettre en oeuvre des
fonctionnalités nouvelles ou encore assez embryonnaires dans les
systèmes actuels de recherche d'information: évaluation de l'existence
d'une réponse à une question dans une base de textes et justification
de la réponse, synthèse de réponses multiples intra ou
inter-documents, dialogue d'aide à la formulation de requête ou encore
capacités de compréhension de texte permettant par exemple de
reconnaître des reprises anaphoriques ou de juger de l'éventuelle
incompatibilité de réponses multiples.

Plus spécifiquement, les propositions de communication pourront
présenter des systèmes de question/réponse dans leur ensemble ou bien
des traitements constitutifs de tels systèmes pourvu qu'ils soient
replacés dans la problématique question/réponse. Parmi ces
traitements, on peut notamment citer:

- analyse de questions: typologie de questions, extraction de l'objet
de la question, de son contexte, de contraintes sémantiques

- reconnaissance d'entités nommées:en domaine ouvert, typage fin

- extraction de passages, appariement question - passage de texte

- similarité de représentations syntaxiques ou sémantiques, partielles
ou complètes

- outils terminologiques: extraction et reconnaissance de termes et de
leurs variantes

- extraction et justification des réponses: patrons de réponse,
inférences, paraphrase ?

La cible privilégiée de cet atelier est constituée par des travaux
opérant sur des bases textuelles importantes ou à partir du WEB mais
les systèmes de question/réponse destinés à des domaines restreints ou
couplés à des bases de connaissances ou des bases de données sont
également concernés.

Les propositions de communication pourront également aborder des
thèmes plus transversaux en relation avec les systèmes de
question/réponse, thèmes parmi lesquels:

- l'apprentissage automatique; que ce soit pour acquérir sur une large
échelle des ressources utilisables par un système de question/réponse
ou plus directement, pour apprendre à sélectionner et extraire la
réponse à une question;

- le multilinguisme: difficulté de passer d'une langue à une autre,
sachant que la plupart des systèmes ont été développés pour l'anglais;
possibilité de poser une question dans une langue et de chercher la
réponse dans des documents écrits dans une autre langue;

- le WEB: utilisation du WEB en tant que source de connaissances ou de
réponses; spécificité de la recherche de réponses sur le WEB;

- le multi-document: fusion et cohérence de réponses multiples.
________________________________________________

SOUMISSION

Les articles soumis pourront aller des résumés longs (4 pages minimum)
à des articles complets jusqu'à 10 pages et devront être rédigés en
français ou en anglais en suivant les consignes de la conférence
principale TALN 2004.  La version définitive sera une version longue.

Le format de soumission sera de préférence le PDF, mais les formats
.doc et .ps seront aussi acceptés.

Les papiers devront être envoyés à Brigitte.Grau at limsi.fr, avec le
sujet TALN-QA

_________________________________________________
CALENDRIER

Date de soumission : 15 Janvier 2004

Notification aux auteurs : 20 Février 2004

Version finale : 8 Mars 2004

Atelier Question-Réponse : 22 Avril 2004

COMITE D'ORGANISATION
Brigitte Grau,  LIMSI, Orsay (responsable)
Olivier Ferret, LIC2M, CEA, Fontenay
Gabriel Illouz, LIMSI, Orsay
Laura Monceaux, IRIN, Nantes
Thierry Poibeau, LIPN, Villetaneuse
Isabelle Robba, LIMSI, Orsay
Anne Vilnat, LIMSI, Orsay

COMITE SCIENTIFIQUE :
Massi-Reza Amini, LIP6, Paris
Patrice Bellot, LIA, Avignon
Mohand Boughanem, IRIT, Toulouse
Jean-Pierre Chevallet, CLIPS, Grenoble
Khalid Choukri, ELDA, Paris
Olivier Collin, France Telecom, Lannion
Olivier Ferret, LIC2M, CEA, Fontenay
Patrick Gallinari, LIP6, Paris
Brigitte Grau, LIMSI, Orsay
Gabriel Illouz, LIMSI, Orsay
Guy Lapalme, RALI, Canada
Claude de Loupy, Sinequa
Jean-Luc Minel, LALICC, Paris
Laura Monceaux, IRIN, Nantes
Thierry Poibeau, LIPN, Villetaneuse
Isabelle Robba, LIMSI, Orsay
Patrick Saint-Dizier, IRIT, Toulouse
Anne Vilnat, LIMSI, Orsay
Pierre Zweigenbaum, STIM, AP-HP Paris

**********************************************************************

CALL FOR PAPER

Held in conjunction with T A L N 2 0 0 4

             Workshop on QUESTION-ANSWERING
  ---

  Palais de Congrès
  Fès (Maroc)

April 22, 2004

  http://www.lpl.univ-aix.fr/jep-taln04/
**********************************************************************

Facing a question such as «What is the most expensive car in the
world?», classical search engines return the documents that are the
most strongly linked to the words of the question, sometimes extract
the excerpts where these words are the most numerous, but let the user
browse texts to actually find an answer. This need leads to develop
systems that are able to extract the parts of documents that are the
most relevant in relation to a question, providing either an answer
when the question is about a precise fact or a summary when it is a
topical question.

These functions can be implemented only if IR systems are able to
analyze both queries and documents more deeply. As a consequence,
question answering is at the crossing of several research fields: of
course, it is grounded in Information Retrieval but it also concerns
Natural Language Processing (NLP) in an important way and to some
extent, fields such as Machine Learning.

Most QA systems are based on a classical search engine that is
enhanced by a question analysis module, a set of modules for
extracting various linguistic features from documents, such as named
entities, terms or syntactic relations, and a module that relies on
all these data for extracting answers by mixing linguistic and
numerical criteria.

Moreover, the QA problem puts forward new functions, or functions that
are still in an embryonic state in current IR systems: evaluating if
an answer to a question exists in a document collection, achieving a
synthesis from multiple or partial answers, using dialog for
constructing a query, or text understanding capabilities for dealing
with anaphora, inferences, or for determining if a set of several
answers is coherent.

More precisely, submissions will present a question answering system
as a whole or will focus on one of its processes provided that it is
put in the question answering context. These processes include but are
not limited to:

- question analysis: question typology, extraction of the question
focus, of the question context or more generally, of semantic
constraints

- named entity recognition: fine-grained named entities, unrestricted
domains

- passage extraction

- full or partial similarity of syntactic structures

- terminological tools: extraction and recognition of terms and their
variants

- extraction and justification of answers: answer patterns,
inferences, paraphrase ?

This workshop is particularly concerned by papers that focus on QA
systems for large collections of documents or the Web but papers about
QA systems for restricted domains or dedicated to knowledge bases or
database will also be taken into account.

Submissions can also tackle cross-domain topics in relation to
Question Answering , such as:

- QA and machine learning: use of machine learning for selecting and
extracting answers to a question but also for building on a large
scale resources that are necessary for QA systems;

- multilingual and crosslingual QA: what are the difficulties for
adapting an existing QA system most of them only work for English to
another language; asking a question in a language and searching an
answer in a collection of documents in another language;

- QA and the Web: using the Web as a source of knowledge or a source
of answers; what are the specific aspects of searching an answer on
the Web;

- multi-document QA: fusion and coherence of multiple answers.

SUBMISSION:

Submissions will be minimum 4 page summaries or long papers of no more
than 10 pages, written in French or English, according to the style of
the main conference TALN 2004.

The final version will be a long paper.
Submission format will be PDF, but .doc and .ps will be also admitted.
Papers have to be sent to Brigitte.Grau at limsi.fr, with TALN-QA as subject.

IMPORTANT DATES:

Submission deadline: 15 January 2004

Notification to authors: 20 February 2004

Camera-ready: 8 March 2004

Question-Answering workshop: 22 April 2004

Groupe LIR - LIMSI
BP 133, 91403 Orsay Cedex
tel. 01 69 85 80 03, fax 01 69 85 80 88
  et
Institut d'Informatique d'Entreprise (IIE)
18 allée Jean Rostand, 91025 Evry Cedex
tel. 01 69 36 73 44, fax 01 69 36 73 09

-------------------------------------------------------------------------
Message diffusé par la liste Langage Naturel <LN at cines.fr>
Informations, abonnement : http://www.biomath.jussieu.fr/LN/LN-F/
English version          : http://www.biomath.jussieu.fr/LN/LN/
Archives                 : http://listserv.linguistlist.org/archives/ln.html

La liste LN est parrainée par l'ATALA (Association pour le Traitement
Automatique des Langues)
Information et adhésion  : http://www.atala.org/
-------------------------------------------------------------------------