Conf: LREC : workshop Creating and Using Semantics for Information Retrieval and Filtering

Alexis Nasr alexis.nasr at LINGUIST.JUSSIEU.FR
Fri May 24 09:25:01 UTC 2002

----- Workshop call for participation in english bellow -----

Veuillez nous excuser pour les réceptions multiples


                Appel à partitipation pour l'atelier

Creating and Using Semantics for Information Retrieval and Filtering

              State of the Art and Future Research

               Las Palmas, Iles Canaries - Espagne

                          2 juin 2002

                     En conjonction avec la
            Troisième conférence internationale LREC
          (Language Resources and Evaluation Conference)

                          (LREC 2002)

Le but de cette conférence est de faire se rencontrer des chercheurs
dans le domaine de la recherche et de l'extraction d'informations et,
plus particulièrement des chercheurs concernés par l'utilité
d'informations sémantiques (provenant de ressources sémantiques ou
de traitements linguistiques) pour affiner les requêtes.

Buts et thèmes de l'atelier

Plusieurs expériences ont été conduites depuis les 15 dernières années,
en utilisant diverses ressources et techniques (thesaurus, listes de
synonymes, désambiguïsation sémantique, etc.) afin d'améliorer le
traitement des requêtes. Néanmoins, les conclusions tirées de ces
expériences sont très différentes de l'une à l'autre. Certains résultats
ont conduit à affirmer que l'utilisation de connaissances sémantiques
n'apporte rien, voire dégrade les résultats tandis que d'autres amènent

la conclusion que des connaissances sémantiques augmentent
significativement les performances des systèmes de recherche

Certaines questions se posent donc :
- Pourquoi les conclusions sont-elles si différentes ?
- La divergence de résultat provient-elle d'une différence de
  méthodologie ?
- Cette divergence provient-elle d'une différence dans les ressources
  utilisées ?
- Quelles sont les ressources les plus adéquates pour ce genre de
  travaux ?
- Les résultats obtenus à partir de ressources créées manuellement
  sont-ils très différents de ceux obtenus avec des ressources extraites
  automatiquement ?
- Depuis la constitution de corpus jusqu'à la structuration de
  terminologie, quels sont les impératifs auquels les méthodologie
  d'acquistion doivent se plier afin d'être pertinent pour une
  application donnée ?
- Quel est l'apport de ressources spécialisées dans un domaine ?
- Les cadres d'évaluation actuels (par exemple TREC) sont-ils appropriés
  pour l'évaluation de ces résultats ?

Ces questions sont fondamentales, non seulement pour les travaux en
recherche documentaire mais aussi pour l'extraction d'informations, la
réponse aux questions, le filtrage, etc. Leur importance est encore plus
critique pour des applications multilingues où, par exemple, la question
de la désambiguïsation avant traduction est fondamentale.

De plus, la diversité croissante des documents monolingues et
multilingues sur la Toile demande à prêter attention au lien entre
la variabilité lexicale et le genre textuel tout en tenant compte
de la réutilisabilité des ressources.

Le but de cet atelier est de faire se rencontrer des chercheurs dans le
domaine de la recherche d'information et, plus particulièrement, des
chercheurs intéressés par l'utilisation de connaissances et de traitements
sémantiques pour l'amélioration du traitement des requêtes.

L'atelier fournira l'occasion, pour les participants, de présenter leur
point de vue. Une table ronde suivra et permettra aux conférenciers de
faire le point sur l'état de l'art, les résultats passés et en cours et
les raisons qui peuvent expliquer les considérables différences que l'on
constate dans les conclusions des différentes expériences. Enfin, ils
tenteront d'identifier les directions à prendre pour les recherches

Dates importantes

- Atelier : 2 juin 2002


9 h 00	Welcome and introduction

9 h 20	Semantics for information management session (C. Fluhr)
9 h 20-9 h 40
	H. Liu & H. Lieberman
	Robust Photo Retrieval Using World Semantics
9 h 40-10 h 00
	R. F. Mihalcea
	The Role of Semantic Networks in Information Retrieval
10 h 00-10 h 20
	T. Brants & R. Stolle
	Finding Redundancy in Document Collections
10 h 20-10 h 40
	C. de Loupy & M. El-Bèze
	Managing Synonymy and Polysemy in a Document Retrieval
	System Using WordNet
10 h 40-11 h 00
	F. Sadat, A. Maeda, M. Yoshikawa & S. Uemura
	Statistical query disambiguation, translation and
	expansion in cross-language information retrieval

11 h 00-11 h 20	coffee break

11 h 20	Word Sense Disambiguation session (N. Ide)
11 h 20-11 h 40
	B. Jacquemin, C. Brun & C. Roux
	Enriching a Text by Semantic Disambiguation for
	Information Extraction
11 h 40-12 h 00
	G. Ramakrishnan & P. Bhattacharyya
	Word Sense Disambiguation Using Semantic Sets based
	on WordNet
12 h 00-12 h 20
	H. Kaji & Y. Morimoto
	Towards Sense-Disambiguated Association Thesauri

12 h 20-13 h 50	lunch

13 h 50	TermAcq session (A. Nazarenko & M. Slodzian)
14 h 00-14 h 20
	N. Grabar, P. Zweigenbaum
	Lexically-Based Terminology Structuring: a Feasibility
14 h 20-14 h 40
	G. de Chalendar & B. Grau
	Expansion by a Contextual Use of Classes of Nouns
14 h 40-15 h 00
	A. Balvet
	Integrating Common and Specific Knowledge in a Rules-
	Based Information Retrieval System

15 h 00	State of the art and future plan Session (C. de Loupy)
15 h 00-15 h 20
	R. Krovetz
	On the Importance of Word Sense Disambiguation for
	Information Retrieval
15 h 20-16 h 20	Round Table


Les frais d'inscription pour l'atelier sont de :
- 90 euros pour les personnes participant à la conférence LREC
- 140 euros pour les personnes qui n'y participent pas

Ces frais incluent deux pauses café et les actes de l'atelier.
La participation à l'atelier est limitée par le nombre de personnes
présentes. Les requêtes seront traitées sur la base du premier arrivé,
premier servi.
Les inscriptions sont gérées par le secrétariat de la conférence LREC.


L'atelier se tiendra au Palacio de Congreso à Las Palmas aux Canaries où
se déroulera la conférence principale LREC. Pour plus d'informations,
merci de se référer au site de LREC :

Informations sur la conférence

Informations générales sur LREC :
Les informations concernant la venue, Las Palmas et les îles Canaries en
général peuvent être obtenues auprès de :

     Octavio Grondonna Morales
     Viajes El Corte Inglés
     Avda. Juan XXIII, 9
     35004 Las Palmas de Gran Canaria
     tél : +34 928 292402
     fax : +34 928 291876
     mél : commercial_lpa at

Comité de programme

	- Marc El-Bèze, Université d'Avignon et des Pays de Vaucluse, France
	- Christian Fluhr, CEA, France
	- Julio Gonzalo, Universidad Nacional de Educación a Distancia, Espagne
	- Graeme Hirst, University of Toronto, Canada
	- Nancy Ide, Vassar College, USA
	- Adam Kilgarriff, University of Brighton, Royaume Uni
	- Claude de Loupy, Sinequa, France
	- Christian Marest, Mediapps, France
	- Patrick Paroubek, LIMSI, France
	- Piek Vossen, Irion Technologies, Les Pays-Bas
	- Phil Edmonds, Sharp Laboratories of Europe LTD, Royaume Uni

Personne à contacter

	Claude de Loupy
	51-59 rue Ledru-Rollin
	94200 Ivry-sur-Seine, France
	tél : +33 1 49 87 06 00 / fax : +33 1 49 87 06 01
	mél : loupy at


Apologies for multiple posts.


                       Call for participation

  Creating and Using Semantics for Information Retrieval and Filtering

              State of the Art and Future Research

               Las Palmas, Canary Islands - Spain
                        2nd of June 2002

                 Held in conjunction with the

Third International Conference on Language Resources and Evaluation

                       (LREC 2002)

The goal of this full day workshop is to bring together researchers
in the domain of information management and extraction, and in particular,
researchers concerned by the utility of enhancing queries with semantic
information gleaned from languages resources and processes.

Workshop scope and aims

Several experiments have been carried out in the last 15 years
investigating the use of various resources and techniques (e.g.,
thesauri, synonyms, word sense disambiguation, etc.) to help refine or
enhance queries. However, the conclusions drawn on the basis of these
experiments vary widely. Results of some studies have led to the
conclusion that semantic information serves no purpose and even
degrades results, while others have concluded that the use of semantic
information drawn from external resources significantly increases the
performance of retrieval software. At this point, several question

  - Why do these conclusions vary so widely?
  - Is the divergence a result of differences in methodology?
  - Is the divergence a result of a difference in resources? What
    are the most suitable resources? Do results using manually
    constructed resources differ in significant ways from results
    using automatically extracted information?
  - From corpus building to terminology structuring, to which
    methodological requirements resources acquisition has to
    comply with in order to be relevant to a given application?
  - What is the contribution of specialized resources?
  - Are present frameworks for evaluation (e.g., TREC) appropriate
    for evaluation of results?.

These questions are fundamental not only to research in document retrieval,
but also for information searching, question answering, filtering, etc.
Their importance is even more acute for multilingual applications, where,
for instance, the question of whether to disambiguate before translating
is fundamental.

Moreover, the increasing diversity of monolingual as well as multilingual
documents on the Web invite to focus attention on lexical variability in
connection with textual genre and with questioning the resources
reusability stance.

The goal of this workshop is to bring together researchers in the domain
of document retrieval, and in particular, researchers on both sides of the
question of the utility of enhancing queries with semantic information
gleaned from languages resources and processes.

The workshop will provide a forum for presentation of the different points
of view, followed by a roundtable in which the participants will assess the
state of the art, consider the results of past and on-going work and the
possible reasons for the considerable differences in their conclusions.
Ultimately, they will attempt to identify future directions for research.

Important dates

- Workshop: June 2nd, 2002


9 h 00	Welcome and introduction

9 h 20	Semantics for information management session (C. Fluhr)
9 h 20-9 h 40
	H. Liu & H. Lieberman
	Robust Photo Retrieval Using World Semantics
9 h 40-10 h 00
	R. F. Mihalcea
	The Role of Semantic Networks in Information Retrieval
10 h 00-10 h 20
	T. Brants & R. Stolle
	Finding Redundancy in Document Collections
10 h 20-10 h 40
	C. de Loupy & M. El-Bèze
	Managing Synonymy and Polysemy in a Document Retrieval
	System Using WordNet
10 h 40-11 h 00
	F. Sadat, A. Maeda, M. Yoshikawa & S. Uemura
	Statistical query disambiguation, translation and
	expansion in cross-language information retrieval

11 h 00-11 h 20	coffee break

11 h 20	Word Sense Disambiguation session (N. Ide)
11 h 20-11 h 40
	B. Jacquemin, C. Brun & C. Roux
	Enriching a Text by Semantic Disambiguation for
	Information Extraction
11 h 40-12 h 00
	G. Ramakrishnan & P. Bhattacharyya
	Word Sense Disambiguation Using Semantic Sets based
	on WordNet
12 h 00-12 h 20
	H. Kaji & Y. Morimoto
	Towards Sense-Disambiguated Association Thesauri

12 h 20-13 h 50	lunch

13 h 50	TermAcq session (A. Nazarenko & M. Slodzian)
14 h 00-14 h 20
	N. Grabar, P. Zweigenbaum
	Lexically-Based Terminology Structuring: a Feasibility
14 h 20-14 h 40
	G. de Chalendar & B. Grau
	Expansion by a Contextual Use of Classes of Nouns
14 h 40-15 h 00
	A. Balvet
	Integrating Common and Specific Knowledge in a Rules-
	Based Information Retrieval System

15 h 00	State of the art and future plan Session (C. de Loupy)
15 h 00-15 h 20
	R. Krovetz
	On the Importance of Word Sense Disambiguation for
	Information Retrieval
15 h 20-16 h 20	Round Table


The registration fee for the workshop is

     90 Euro if you are attending LREC
     140 Euro if you are NOT attending LREC

The fee includes two coffee breaks and the workshop proceedings.

Participation in the workshop is limited by the venue. Requests for
participation will be processed on a first come first served basis.
Registration is handled by the LREC Secretariat.


The workshop will take place at the Palacio de Congreso de Canarias,
where the main LREC Conference will be held. For more information, please
refer to the LREC website :

Conference Information

General information on LREC:
Information on travel, accommodation and general information on Las Palmas
and the Canary Islands can be obtained from:

     Octavio Grondonna Morales
     Viajes El Corte Inglés
     Avda. Juan XXIII, 9
     35004 Las Palmas de Gran Canaria
     Tel: +34 928 292402
     Fax: +34 928 291876
     E-mail: commercial_lpa at

Program Committee

  - Roberto Basili, Univ. Roma, Italy
  - Olivier Bodenreider, National Library of Medicine, USA
  - Tony Bryant, University of Leeds, United Kingdom
  - Theresa Cabré, IULA-UPF, Spain
  - Phil Edmonds, Sharp Laboratories of Europe LTD, United Kingdom
  - Marc El-Bèze, Université d'Avignon et des Pays de Vaucluse, France
  - Christian Fluhr, CEA, France
  - Julio Gonzalo, Universidad Nacional de Educación a Distancia, Spain
  - Natalia Grabar, AP-HP & INaLCO, France
  - Thierry Hamon, LIPN, Université de Paris-Nord, France
  - Graeme Hirst, University of Toronto, Canada
  - John Humbley, Univiversité de Paris 7, France
  - Nancy Ide, Vassar College, USA
  - Adam Kilgarriff, University of Brighton, United Kingdom
  - Marie-Claude L'Homme, Université de Montréal, Canada
  - Claude de Loupy, Sinequa, France
  - Christian Marest, Mediapps, France
  - Adeline Nazarenko, LIPN, Université de Paris-Nord, France
  - Patrick Paroubek, LIMSI, France
  - Monique Slodzian, CRIM, INALCO, France
  - Piek Vossen, Irion Technologies, The Netherlands
  - Pierre Zweigenbaum, AP-HP, Université de Paris 6, France

Contact Person

  Claude de Loupy
  51-59 rue Ledru-Rollin
  94200 Ivry-sur-Seine, France
  Tel: +33 1 49 87 06 00 / Fax: +33 1 49 87 06 01
  email: loupy at

Claude de Loupy - Head of Research
Sinequa -
Home page: (in French, sorry)
Message diffusé par la liste Langage Naturel <LN at>
Informations, abonnement :
English version          :
Archives                 :

La liste LN est parrainée par l'ATALA (Association pour le Traitement
Automatique des Langues)
Information et adhésion  :

More information about the Ln mailing list