[Corpora-List] CfP INFILE 2: Information, Filtering, Evaluation - Evaluation campaign for information filtering systems
Helene Mazo
info at elda.org
Mon Jan 12 13:51:04 UTC 2009
Apologies for cross-postings
French version below...
********************************************************************
INFILE : Information, Filtering, Evaluation
Evaluation campaign for information filtering systems
INFILE 2
Call for participation
info at infile.org
http://www.infile.org
********************************************************************
INFILE (INformation, Filtering, Evaluation) is a cross-language
filtering evaluation campaign jointly organized by CEA, University of
Lille 3 (GERiiCO) and ELDA,
with the support of CLEF (Cross Language Evaluation Forum).
Following the first edition already organized as a pilot track of CLEF
2008, the 2009 edition proposes two evaluation tasks:
- an interactive filtering task, as in the previous campaign,
- and a batch filtering task, which is a new task.
The three languages concerned by INFILE are Arabic, English and French.
Systems participating
to the campaign may be evaluated on the two tasks or only one task and
according to the crosslingual or monolingual environment.
Corpus
------
The corpus consists of 300,000 news-wires in Arabic, English and French
from the news agency Agence France Presse covering the 2004-2006 period.
The news-wires
are related to general news and events information and are comparable
between Arabic, English and French.
A set of 50 profiles will be made available in 3 languages (Arabic,
English and French), 30 of them are general news and events and 20 are
related to scientific fields.
Although cross-lingual systems are encouraged, the campaign is also open
to monolingual systems.
Protocol description
---------------------
For the interactive task, evaluation will be performed using an
automatic interrogation of test systems with a simulated user feedback.
Each system will be able to use
the feedback at any time to increase performance.
News-wires are transmitted to participating systems through an automated
interface. The systems return a Boolean response for each profile using
the same interface.
After reception of this response, and if requested by the participant, a
feedback can be supplied, that consists of the expected profile
assignment for the document submitted.
A curve of the evolution of efficiency will be computed.
For the batch task, the whole corpus of documents and the set of
profiles are provided to the participants and the systems are expected
to give back the results of the filtering system.
INFILE welcomes participation of any institution, academic an
industrial. The participation is free of charge and participants can
keep and use the development and evaluation
data for free after the evaluations for research and development purposes.
Important Dates
-----------------
January 2009: Registration Opens.
April 01st to May 30th, 2009 : session of Batch Filtering.
June 01st to June 30th, 2009 : session of Adaptive Filtering.
July 15th, 2009: Communication of Individual Results.
August 30th, 2009 : Submission of Paper for CLEF.
Contact
---------
info at infile.org
http://www.infile.org
[French version]
********************************************************************
INFILE : INformation, FILtrage, Evaluation
Campagne d'évaluation des systèmes de filtrage d'information
INFILE 2
Appel à participation
info at infile.org
http://www.infile.org
********************************************************************
InFile est une campagne d'évaluation des systèmes de filtrage
d'information interlingue en contexte de veille, organisée par le CEA
LIST, l'Université de Lille 3 (Lab. GERiiCO)
et l'agence ELDA, qui s'inscrit dans le cadre des campagnes CLEF (Cross
Language Evaluation Forum).
Après l'édition 2008, déjà organisée dans le cadre de CLEF, la deuxième
édition de INFILE propose deux tâches pour l'évaluation :
- comme en 2008, une première tâche concerne le filtrage
adaptatif ;
- une seconde tâche, qui est nouvelle, concerne le filtrage de
documents en mode non-adaptatif (c'est-à-dire par lot).
Les langues concernées par l'évaluation sont l'anglais, l'arabe et le
français. Les participants peuvent s'inscrire aux deux tâches ou à l'une
ou l'autre. Bien que l'évaluation
en contexte interlingue soit encouragée, les participants peuvent
choisir de faire un filtrage monolingue.
Corpus
------
Le corpus d'évaluation est constitué de dépêches de l'agence de presse
AFP en trois langues : anglais, arabe et français, il comprend environ
100 000 dépêches par langue,
publiées entre 2004 et 2006.
Un ensemble de 50 profils sera disponible dans les trois langues, dont
30 profils sur des sujets d'intérêt général et 20 profils portant sur
l'information scientifique et technique.
Description du protocole
--------------------------
Pour se rapprocher des conditions d'un usage réel de systèmes, le
protocole (tâches, métriques, volumétrie du corpus, modèles de profils,
types d'assesseurs...) a été développé
en concertation avec des experts du domaine sur la base d'un ensemble de
vérités-terrain, relevées dans une pratique de veille avec systèmes de
filtrage.
Pour le filtrage adaptatif : les participants disposeront des profils et
recevront les dépêches l'une après l'autre. Ils retourneront les
résultats pour chacune des dépêches. A chaque réponse,
une validation des résultats pourra être fournie automatiquement aux
systèmes adaptatifs pour une possibilité d'amélioration. Une métrique
est prévue pour évaluer le degré d'adaptabilité
des systèmes en question.
Pour le filtrage en mode non-adaptatif : les participants disposeront de
la totalité du corpus et des profils et retourneront les documents jugés
pertinents par rapport à chaque profil.
La campagne INFILE s'adresse à tout organisme industriel ou académique
disposant d'un système de filtrage d'information monolingue ou
interlingue, traitant au moins une des langues
de la campagne (anglais, arabe, français). La participation se fait sur
la base du volontariat sans soutien financier, en échange du kit
d'évaluation distribué, de la possibilité d'assister
aux réunions de travail de la campagne et de bénéficier ainsi d'une
structure d'échange et de réflexion regroupant des développeurs,
industriels et chercheurs.
Pour signaler votre intention de participer, merci d'envoyer un message
à info at infile.org au plus tard le 01/04/09. Les organismes acceptés
seront invités à signer une convention réglementant
l'utilisation des données du projet et s'engagent à accepter la
publication des résultats. Nous rappelons que ce projet n'est pas limité
aux acteurs français.
Dates importantes
--------------------------
15/01/09 : Inscription des participants (avec diffusion des
recommandations et vérifications techniques).
01/04/09 au 30/05/09 : session du filtrage non-adaptatif.
01/06/09 au 30/06/09 : session du filtrage adaptatif.
15/07/09 : Communication des résultats (scores) aux participants.
15/08/09 : Réception des soumissions d'articles des participants.
30/08/09 : Soumission de l'article final à CLEF.
Le détail de cet appel (définition des tâches et des métriques, thèmes
et applications, déroulement de la campagne, calendrier définitif...)
est disponible à l'adresse du projet : http://www.infile.org.
-------------- next part --------------
An HTML attachment was scrubbed...
URL: <http://listserv.linguistlist.org/pipermail/corpora/attachments/20090112/d4df3e83/attachment.htm>
-------------- next part --------------
_______________________________________________
Corpora mailing list
Corpora at uib.no
http://mailman.uib.no/listinfo/corpora
More information about the Corpora
mailing list