[Corpora-List] CfP INFILE 2: Information, Filtering, Evaluation - Evaluation campaign for information filtering systems

Helene Mazo info at elda.org
Mon Jan 12 13:51:04 UTC 2009


Apologies for cross-postings
French version below...

 

********************************************************************

    INFILE : Information, Filtering, Evaluation
    Evaluation campaign for information filtering systems

    INFILE 2
    Call for participation
    info at infile.org 
    http://www.infile.org

********************************************************************

INFILE (INformation, Filtering, Evaluation) is a cross-language 
filtering evaluation campaign jointly organized by CEA, University of 
Lille 3 (GERiiCO) and ELDA,
with the support of CLEF (Cross Language Evaluation Forum).

Following the first edition already organized as a pilot track of CLEF 
2008, the 2009 edition proposes two evaluation tasks:

-          an interactive filtering task, as in the previous campaign,
-          and a batch filtering task, which is a new task.

The three languages concerned by INFILE are Arabic, English and French. 
Systems participating
to the campaign may be evaluated on the two tasks or only one task and 
according to the crosslingual or monolingual environment.

Corpus
------

The corpus consists of 300,000 news-wires in Arabic, English and French 
from the news agency Agence France Presse covering the 2004-2006 period. 
The news-wires
are related to general news and events information and are comparable 
between Arabic, English and French.

A set of 50 profiles will be made available in 3 languages (Arabic, 
English and French), 30 of them are general news and events and 20 are 
related to scientific fields.

Although cross-lingual systems are encouraged, the campaign is also open 
to monolingual systems.


Protocol description
---------------------

For the interactive task, evaluation will be performed using an 
automatic interrogation of test systems with a simulated user feedback. 
Each system will be able to use
the feedback at any time to increase performance.

News-wires are transmitted to participating systems through an automated 
interface. The systems return a Boolean response for each profile using 
the same interface.
After reception of this response, and if requested by the participant, a 
feedback can be supplied, that consists of the expected profile 
assignment for the document submitted.
A curve of the evolution of efficiency will be computed.

For the batch task, the whole corpus of documents and the set of 
profiles are provided to the participants and the systems are expected 
to give back the results of the filtering system.

INFILE welcomes participation of any institution, academic an 
industrial. The participation is free of charge and participants can 
keep and use the development and evaluation
data for free after the evaluations for research and development purposes.


Important Dates
-----------------

    January 2009: Registration Opens.

    April 01st to May 30th, 2009 : session of Batch Filtering.

    June 01st to June 30th, 2009 : session of Adaptive Filtering.

    July 15th, 2009: Communication of Individual Results.

    August 30th, 2009 : Submission of Paper for CLEF.



Contact
---------

    info at infile.org
    http://www.infile.org

 
[French version]

********************************************************************

    INFILE : INformation, FILtrage, Evaluation
    Campagne d'évaluation des systèmes de filtrage d'information

    INFILE 2
    Appel à participation
    info at infile.org
    http://www.infile.org

********************************************************************

InFile est une campagne d'évaluation des systèmes de filtrage 
d'information interlingue en contexte de veille, organisée par le CEA 
LIST, l'Université de Lille 3 (Lab. GERiiCO)
et l'agence ELDA, qui s'inscrit dans le cadre des campagnes CLEF (Cross 
Language Evaluation Forum).
 

Après l'édition 2008, déjà organisée dans le cadre de CLEF, la deuxième 
édition de INFILE propose deux tâches pour l'évaluation :

-          comme en 2008, une première tâche concerne le filtrage 
adaptatif ;
-          une seconde tâche, qui est nouvelle, concerne le filtrage de 
documents en mode non-adaptatif (c'est-à-dire par lot).
 

Les langues concernées par l'évaluation sont l'anglais, l'arabe et le 
français. Les participants peuvent s'inscrire aux deux tâches ou à l'une 
ou l'autre. Bien que l'évaluation
en contexte interlingue soit encouragée, les participants peuvent 
choisir de faire un filtrage monolingue.
 

Corpus
------

Le corpus d'évaluation est constitué de dépêches de l'agence de presse 
AFP en trois langues : anglais, arabe et français, il comprend environ 
100 000 dépêches par langue,
publiées entre 2004 et 2006.


Un ensemble de 50 profils sera disponible dans les trois langues, dont 
30 profils sur des sujets d'intérêt général et 20 profils portant sur 
l'information scientifique et technique.


Description du protocole
--------------------------

Pour se rapprocher des conditions d'un usage réel de systèmes, le 
protocole (tâches, métriques, volumétrie du corpus, modèles de profils, 
types d'assesseurs...) a été développé
en concertation avec des experts du domaine sur la base d'un ensemble de 
vérités-terrain, relevées dans une pratique de veille avec systèmes de 
filtrage.


Pour le filtrage adaptatif : les participants disposeront des profils et 
recevront les dépêches l'une après l'autre. Ils retourneront les 
résultats pour chacune des dépêches. A chaque réponse,
une validation des résultats pourra être fournie automatiquement aux 
systèmes adaptatifs pour une possibilité d'amélioration. Une métrique 
est prévue pour évaluer le degré d'adaptabilité
des systèmes en question.


Pour le filtrage en mode non-adaptatif : les participants disposeront de 
la totalité du corpus et des profils et retourneront les documents jugés 
pertinents par rapport à chaque profil.

La campagne INFILE s'adresse à tout organisme industriel ou académique 
disposant d'un système de filtrage d'information monolingue ou 
interlingue, traitant au moins une des langues
de la campagne (anglais, arabe, français). La participation se fait sur 
la base du volontariat sans soutien financier, en échange du kit 
d'évaluation distribué, de la possibilité d'assister
aux réunions de travail de la campagne et de bénéficier ainsi d'une 
structure d'échange et de réflexion regroupant des développeurs, 
industriels et chercheurs.
 

Pour signaler votre intention de participer, merci d'envoyer un message 
à info at infile.org au plus tard le 01/04/09. Les organismes acceptés 
seront invités à signer une convention réglementant
l'utilisation des données du projet et s'engagent à accepter la 
publication des résultats. Nous rappelons que ce projet n'est pas limité 
aux acteurs français.
 

Dates importantes
--------------------------

  15/01/09 : Inscription des participants (avec diffusion des 
recommandations et vérifications techniques).

  01/04/09 au 30/05/09 : session du filtrage non-adaptatif.

  01/06/09 au 30/06/09 : session du filtrage adaptatif.

  15/07/09 : Communication des résultats (scores) aux participants.

  15/08/09 : Réception des soumissions d'articles des participants.

  30/08/09 : Soumission de l'article final à CLEF.


Le détail de cet appel (définition des tâches et des métriques, thèmes 
et applications, déroulement de la campagne, calendrier définitif...) 
est disponible à l'adresse du projet : http://www.infile.org.

-------------- next part --------------
An HTML attachment was scrubbed...
URL: <http://listserv.linguistlist.org/pipermail/corpora/attachments/20090112/d4df3e83/attachment.htm>
-------------- next part --------------
_______________________________________________
Corpora mailing list
Corpora at uib.no
http://mailman.uib.no/listinfo/corpora


More information about the Corpora mailing list