Appel: INFILE 2, Information, Filtering, Evaluation - Evaluation campaign for information filtering systems
Thierry Hamon
thierry.hamon at LIPN.UNIV-PARIS13.FR
Tue Jan 13 15:04:59 UTC 2009
Date: Mon, 12 Jan 2009 14:51:04 +0100
From: info at elda.org
Message-ID: <496B4AC8.7050107 at elda.org>
X-url: http://www.infile.org
Apologies for cross-postings
French version below...
********************************************************************
INFILE : Information, Filtering, Evaluation
Evaluation campaign for information filtering systems
INFILE 2
Call for participation
info at infile.org
http://www.infile.org
********************************************************************
INFILE (INformation, Filtering, Evaluation) is a cross-language
filtering evaluation campaign jointly organized by CEA, University of
Lille 3 (GERiiCO) and ELDA,
with the support of CLEF (Cross Language Evaluation Forum).
Following the first edition already organized as a pilot track of CLEF
2008, the 2009 edition proposes two evaluation tasks:
- an interactive filtering task, as in the previous campaign,
- and a batch filtering task, which is a new task.
The three languages concerned by INFILE are Arabic, English and
French. Systems participating to the campaign may be evaluated on the
two tasks or only one task and according to the crosslingual or
monolingual environment.
Corpus
------
The corpus consists of 300,000 news-wires in Arabic, English and
French from the news agency Agence France Presse covering the
2004-2006 period. The news-wires are related to general news and
events information and are comparable between Arabic, English and
French.
A set of 50 profiles will be made available in 3 languages (Arabic,
English and French), 30 of them are general news and events and 20 are
related to scientific fields.
Although cross-lingual systems are encouraged, the campaign is also
open to monolingual systems.
Protocol description
---------------------
For the interactive task, evaluation will be performed using an
automatic interrogation of test systems with a simulated user
feedback. Each system will be able to use the feedback at any time to
increase performance.
News-wires are transmitted to participating systems through an
automated interface. The systems return a Boolean response for each
profile using the same interface.
After reception of this response, and if requested by the participant,
a feedback can be supplied, that consists of the expected profile
assignment for the document submitted.
A curve of the evolution of efficiency will be computed.
For the batch task, the whole corpus of documents and the set of
profiles are provided to the participants and the systems are expected
to give back the results of the filtering system.
INFILE welcomes participation of any institution, academic an
industrial. The participation is free of charge and participants can
keep and use the development and evaluation data for free after the
evaluations for research and development purposes..
Important Dates
-----------------
January 2009: Registration Opens.
April 01st to May 30th, 2009 : session of Batch Filtering.
June 01st to June 30th, 2009 : session of Adaptive Filtering.
July 15th, 2009: Communication of Individual Results.
August 30th, 2009 : Submission of Paper for CLEF.
Contact
---------
info at infile.org
http://www.infile.org
[French version]
********************************************************************
INFILE : INformation, FILtrage, Evaluation
Campagne d'évaluation des systèmes de filtrage d'information
INFILE 2
Appel à participation
info at infile.org
http://www.infile.org
********************************************************************
InFile est une campagne d'évaluation des systèmes de filtrage
d'information interlingue en contexte de veille, organisée par le CEA
LIST, l'Université de Lille 3 (Lab. GERiiCO) et l'agence ELDA, qui
s'inscrit dans le cadre des campagnes CLEF (Cross Language Evaluation
Forum).
Après l'édition 2008, déjà organisée dans le cadre de CLEF, la
deuxième édition de INFILE propose deux tâches pour l'évaluation :
- comme en 2008, une première tâche concerne le filtrage adaptatif ;
- une seconde tâche, qui est nouvelle, concerne le filtrage de
documents en mode non-adaptatif (c'est-à-dire par lot).
Les langues concernées par l'évaluation sont l'anglais, l'arabe et le
français. Les participants peuvent s'inscrire aux deux tâches ou à
l'une ou l'autre. Bien que l'évaluation en contexte interlingue soit
encouragée, les participants peuvent choisir de faire un filtrage
monolingue.
Corpus
------
Le corpus d'évaluation est constitué de dépêches de l'agence de presse
AFP en trois langues : anglais, arabe et français, il comprend environ
100 000 dépêches par langue, publiées entre 2004 et 2006.
Un ensemble de 50 profils sera disponible dans les trois langues, dont
30 profils sur des sujets d'intérêt général et 20 profils portant sur
l'information scientifique et technique.
Description du protocole
--------------------------
Pour se rapprocher des conditions d'un usage réel de systèmes, le
protocole (tâches, métriques, volumétrie du corpus, modèles de
profils, types d'assesseurs...) a été développé en concertation avec
des experts du domaine sur la base d'un ensemble de vérités-terrain,
relevées dans une pratique de veille avec systèmes de filtrage.
Pour le filtrage adaptatif : les participants disposeront des profils
et recevront les dépêches l'une après l'autre. Ils retourneront les
résultats pour chacune des dépêches. A chaque réponse, une validation
des résultats pourra être fournie automatiquement aux systèmes
adaptatifs pour une possibilité d'amélioration. Une métrique est
prévue pour évaluer le degré d'adaptabilité des systèmes en question.
Pour le filtrage en mode non-adaptatif : les participants disposeront
de la totalité du corpus et des profils et retourneront les documents
jugés pertinents par rapport à chaque profil.
La campagne INFILE s'adresse à tout organisme industriel ou académique
disposant d'un système de filtrage d'information monolingue ou
interlingue, traitant au moins une des langues de la campagne
(anglais, arabe, français). La participation se fait sur la base du
volontariat sans soutien financier, en échange du kit d'évaluation
distribué, de la possibilité d'assister aux réunions de travail de la
campagne et de bénéficier ainsi d'une structure d'échange et de
réflexion regroupant des développeurs, industriels et chercheurs.
Pour signaler votre intention de participer, merci d'envoyer un
message à info at infile.org au plus tard le 01/04/09. Les organismes
acceptés seront invités à signer une convention réglementant
l'utilisation des données du projet et s'engagent à accepter la
publication des résultats. Nous rappelons que ce projet n'est pas
limité aux acteurs français.
Dates importantes
--------------------------
15/01/09 : Inscription des participants (avec diffusion des
recommandations et vérifications techniques).
01/04/09 au 30/05/09 : session du filtrage non-adaptatif.
01/06/09 au 30/06/09 : session du filtrage adaptatif.
15/07/09 : Communication des résultats (scores) aux participants.
15/08/09 : Réception des soumissions d'articles des participants.
30/08/09 : Soumission de l'article final à CLEF.
Le détail de cet appel (définition des tâches et des métriques, thèmes
et applications, déroulement de la campagne, calendrier définitif...)
est disponible à l'adresse du projet : http://www.infile.org.
-------------------------------------------------------------------------
Message diffuse par la liste Langage Naturel <LN at cines.fr>
Informations, abonnement : http://www.atala.org/article.php3?id_article=48
English version :
Archives : http://listserv.linguistlist.org/archives/ln.html
http://liste.cines.fr/info/ln
La liste LN est parrainee par l'ATALA (Association pour le Traitement
Automatique des Langues)
Information et adhesion : http://www.atala.org/
-------------------------------------------------------------------------
More information about the Ln
mailing list