Conf: LREC : workshop Creating and Using Semantics for Information Retrieval and Filtering
Alexis Nasr
alexis.nasr at LINGUIST.JUSSIEU.FR
Fri May 24 09:25:01 UTC 2002
----- Workshop call for participation in english bellow -----
Veuillez nous excuser pour les réceptions multiples
-------------------------------------------------------------------------
Appel à partitipation pour l'atelier
Creating and Using Semantics for Information Retrieval and Filtering
State of the Art and Future Research
Las Palmas, Iles Canaries - Espagne
2 juin 2002
En conjonction avec la
Troisième conférence internationale LREC
(Language Resources and Evaluation Conference)
(LREC 2002)
Le but de cette conférence est de faire se rencontrer des chercheurs
dans le domaine de la recherche et de l'extraction d'informations et,
plus particulièrement des chercheurs concernés par l'utilité
d'informations sémantiques (provenant de ressources sémantiques ou
de traitements linguistiques) pour affiner les requêtes.
Buts et thèmes de l'atelier
---------------------------
Plusieurs expériences ont été conduites depuis les 15 dernières années,
en utilisant diverses ressources et techniques (thesaurus, listes de
synonymes, désambiguïsation sémantique, etc.) afin d'améliorer le
traitement des requêtes. Néanmoins, les conclusions tirées de ces
expériences sont très différentes de l'une à l'autre. Certains résultats
ont conduit à affirmer que l'utilisation de connaissances sémantiques
n'apporte rien, voire dégrade les résultats tandis que d'autres amènent
la conclusion que des connaissances sémantiques augmentent
significativement les performances des systèmes de recherche
d'information.
Certaines questions se posent donc :
- Pourquoi les conclusions sont-elles si différentes ?
- La divergence de résultat provient-elle d'une différence de
méthodologie ?
- Cette divergence provient-elle d'une différence dans les ressources
utilisées ?
- Quelles sont les ressources les plus adéquates pour ce genre de
travaux ?
- Les résultats obtenus à partir de ressources créées manuellement
sont-ils très différents de ceux obtenus avec des ressources extraites
automatiquement ?
- Depuis la constitution de corpus jusqu'à la structuration de
terminologie, quels sont les impératifs auquels les méthodologie
d'acquistion doivent se plier afin d'être pertinent pour une
application donnée ?
- Quel est l'apport de ressources spécialisées dans un domaine ?
- Les cadres d'évaluation actuels (par exemple TREC) sont-ils appropriés
pour l'évaluation de ces résultats ?
Ces questions sont fondamentales, non seulement pour les travaux en
recherche documentaire mais aussi pour l'extraction d'informations, la
réponse aux questions, le filtrage, etc. Leur importance est encore plus
critique pour des applications multilingues où, par exemple, la question
de la désambiguïsation avant traduction est fondamentale.
De plus, la diversité croissante des documents monolingues et
multilingues sur la Toile demande à prêter attention au lien entre
la variabilité lexicale et le genre textuel tout en tenant compte
de la réutilisabilité des ressources.
Le but de cet atelier est de faire se rencontrer des chercheurs dans le
domaine de la recherche d'information et, plus particulièrement, des
chercheurs intéressés par l'utilisation de connaissances et de traitements
sémantiques pour l'amélioration du traitement des requêtes.
L'atelier fournira l'occasion, pour les participants, de présenter leur
point de vue. Une table ronde suivra et permettra aux conférenciers de
faire le point sur l'état de l'art, les résultats passés et en cours et
les raisons qui peuvent expliquer les considérables différences que l'on
constate dans les conclusions des différentes expériences. Enfin, ils
tenteront d'identifier les directions à prendre pour les recherches
futures.
Dates importantes
-----------------
- Atelier : 2 juin 2002
Programme
---------
9 h 00 Welcome and introduction
9 h 20 Semantics for information management session (C. Fluhr)
9 h 20-9 h 40
H. Liu & H. Lieberman
Robust Photo Retrieval Using World Semantics
9 h 40-10 h 00
R. F. Mihalcea
The Role of Semantic Networks in Information Retrieval
10 h 00-10 h 20
T. Brants & R. Stolle
Finding Redundancy in Document Collections
10 h 20-10 h 40
C. de Loupy & M. El-Bèze
Managing Synonymy and Polysemy in a Document Retrieval
System Using WordNet
10 h 40-11 h 00
F. Sadat, A. Maeda, M. Yoshikawa & S. Uemura
Statistical query disambiguation, translation and
expansion in cross-language information retrieval
11 h 00-11 h 20 coffee break
11 h 20 Word Sense Disambiguation session (N. Ide)
11 h 20-11 h 40
B. Jacquemin, C. Brun & C. Roux
Enriching a Text by Semantic Disambiguation for
Information Extraction
11 h 40-12 h 00
G. Ramakrishnan & P. Bhattacharyya
Word Sense Disambiguation Using Semantic Sets based
on WordNet
12 h 00-12 h 20
H. Kaji & Y. Morimoto
Towards Sense-Disambiguated Association Thesauri
12 h 20-13 h 50 lunch
13 h 50 TermAcq session (A. Nazarenko & M. Slodzian)
14 h 00-14 h 20
N. Grabar, P. Zweigenbaum
Lexically-Based Terminology Structuring: a Feasibility
Stud
14 h 20-14 h 40
G. de Chalendar & B. Grau
Expansion by a Contextual Use of Classes of Nouns
14 h 40-15 h 00
A. Balvet
Integrating Common and Specific Knowledge in a Rules-
Based Information Retrieval System
15 h 00 State of the art and future plan Session (C. de Loupy)
15 h 00-15 h 20
R. Krovetz
On the Importance of Word Sense Disambiguation for
Information Retrieval
15 h 20-16 h 20 Round Table
Inscriptions
------------
Les frais d'inscription pour l'atelier sont de :
- 90 euros pour les personnes participant à la conférence LREC
- 140 euros pour les personnes qui n'y participent pas
Ces frais incluent deux pauses café et les actes de l'atelier.
La participation à l'atelier est limitée par le nombre de personnes
présentes. Les requêtes seront traitées sur la base du premier arrivé,
premier servi.
Les inscriptions sont gérées par le secrétariat de la conférence LREC.
Venue
-----
L'atelier se tiendra au Palacio de Congreso à Las Palmas aux Canaries où
se déroulera la conférence principale LREC. Pour plus d'informations,
merci de se référer au site de LREC :
http://www.lrec-conf.org/lrec2002/index.html
Informations sur la conférence
------------------------------
Informations générales sur LREC :
http://www.lrec-conf.org/lrec2002/index.html
Les informations concernant la venue, Las Palmas et les îles Canaries en
général peuvent être obtenues auprès de :
Octavio Grondonna Morales
Viajes El Corte Inglés
Avda. Juan XXIII, 9
35004 Las Palmas de Gran Canaria
tél : +34 928 292402
fax : +34 928 291876
mél : commercial_lpa at viajeseci.es
Comité de programme
-------------------
- Marc El-Bèze, Université d'Avignon et des Pays de Vaucluse, France
- Christian Fluhr, CEA, France
- Julio Gonzalo, Universidad Nacional de Educación a Distancia, Espagne
- Graeme Hirst, University of Toronto, Canada
- Nancy Ide, Vassar College, USA
- Adam Kilgarriff, University of Brighton, Royaume Uni
- Claude de Loupy, Sinequa, France
- Christian Marest, Mediapps, France
- Patrick Paroubek, LIMSI, France
- Piek Vossen, Irion Technologies, Les Pays-Bas
- Phil Edmonds, Sharp Laboratories of Europe LTD, Royaume Uni
Personne à contacter
--------------------
Claude de Loupy
Sinequa
51-59 rue Ledru-Rollin
94200 Ivry-sur-Seine, France
tél : +33 1 49 87 06 00 / fax : +33 1 49 87 06 01
mél : loupy at sinequa.com
--------------------------------------------------------------------
Apologies for multiple posts.
--------------------------------------------------------------------
Call for participation
Creating and Using Semantics for Information Retrieval and Filtering
State of the Art and Future Research
Las Palmas, Canary Islands - Spain
2nd of June 2002
Held in conjunction with the
Third International Conference on Language Resources and Evaluation
(LREC 2002)
The goal of this full day workshop is to bring together researchers
in the domain of information management and extraction, and in particular,
researchers concerned by the utility of enhancing queries with semantic
information gleaned from languages resources and processes.
Workshop scope and aims
-----------------------
Several experiments have been carried out in the last 15 years
investigating the use of various resources and techniques (e.g.,
thesauri, synonyms, word sense disambiguation, etc.) to help refine or
enhance queries. However, the conclusions drawn on the basis of these
experiments vary widely. Results of some studies have led to the
conclusion that semantic information serves no purpose and even
degrades results, while others have concluded that the use of semantic
information drawn from external resources significantly increases the
performance of retrieval software. At this point, several question
arise:
- Why do these conclusions vary so widely?
- Is the divergence a result of differences in methodology?
- Is the divergence a result of a difference in resources? What
are the most suitable resources? Do results using manually
constructed resources differ in significant ways from results
using automatically extracted information?
- From corpus building to terminology structuring, to which
methodological requirements resources acquisition has to
comply with in order to be relevant to a given application?
- What is the contribution of specialized resources?
- Are present frameworks for evaluation (e.g., TREC) appropriate
for evaluation of results?.
These questions are fundamental not only to research in document retrieval,
but also for information searching, question answering, filtering, etc.
Their importance is even more acute for multilingual applications, where,
for instance, the question of whether to disambiguate before translating
is fundamental.
Moreover, the increasing diversity of monolingual as well as multilingual
documents on the Web invite to focus attention on lexical variability in
connection with textual genre and with questioning the resources
reusability stance.
The goal of this workshop is to bring together researchers in the domain
of document retrieval, and in particular, researchers on both sides of the
question of the utility of enhancing queries with semantic information
gleaned from languages resources and processes.
The workshop will provide a forum for presentation of the different points
of view, followed by a roundtable in which the participants will assess the
state of the art, consider the results of past and on-going work and the
possible reasons for the considerable differences in their conclusions.
Ultimately, they will attempt to identify future directions for research.
Important dates
---------------
- Workshop: June 2nd, 2002
Program
----------
9 h 00 Welcome and introduction
9 h 20 Semantics for information management session (C. Fluhr)
9 h 20-9 h 40
H. Liu & H. Lieberman
Robust Photo Retrieval Using World Semantics
9 h 40-10 h 00
R. F. Mihalcea
The Role of Semantic Networks in Information Retrieval
10 h 00-10 h 20
T. Brants & R. Stolle
Finding Redundancy in Document Collections
10 h 20-10 h 40
C. de Loupy & M. El-Bèze
Managing Synonymy and Polysemy in a Document Retrieval
System Using WordNet
10 h 40-11 h 00
F. Sadat, A. Maeda, M. Yoshikawa & S. Uemura
Statistical query disambiguation, translation and
expansion in cross-language information retrieval
11 h 00-11 h 20 coffee break
11 h 20 Word Sense Disambiguation session (N. Ide)
11 h 20-11 h 40
B. Jacquemin, C. Brun & C. Roux
Enriching a Text by Semantic Disambiguation for
Information Extraction
11 h 40-12 h 00
G. Ramakrishnan & P. Bhattacharyya
Word Sense Disambiguation Using Semantic Sets based
on WordNet
12 h 00-12 h 20
H. Kaji & Y. Morimoto
Towards Sense-Disambiguated Association Thesauri
12 h 20-13 h 50 lunch
13 h 50 TermAcq session (A. Nazarenko & M. Slodzian)
14 h 00-14 h 20
N. Grabar, P. Zweigenbaum
Lexically-Based Terminology Structuring: a Feasibility
Stud
14 h 20-14 h 40
G. de Chalendar & B. Grau
Expansion by a Contextual Use of Classes of Nouns
14 h 40-15 h 00
A. Balvet
Integrating Common and Specific Knowledge in a Rules-
Based Information Retrieval System
15 h 00 State of the art and future plan Session (C. de Loupy)
15 h 00-15 h 20
R. Krovetz
On the Importance of Word Sense Disambiguation for
Information Retrieval
15 h 20-16 h 20 Round Table
Registration
------------
The registration fee for the workshop is
90 Euro if you are attending LREC
140 Euro if you are NOT attending LREC
The fee includes two coffee breaks and the workshop proceedings.
Participation in the workshop is limited by the venue. Requests for
participation will be processed on a first come first served basis.
Registration is handled by the LREC Secretariat.
Venue
-----
The workshop will take place at the Palacio de Congreso de Canarias,
where the main LREC Conference will be held. For more information, please
refer to the LREC website : http://www.lrec-conf.org/lrec2002/index.html
Conference Information
----------------------
General information on LREC: http://www.lrec-conf.org/lrec2002/index.html
Information on travel, accommodation and general information on Las Palmas
and the Canary Islands can be obtained from:
Octavio Grondonna Morales
Viajes El Corte Inglés
Avda. Juan XXIII, 9
35004 Las Palmas de Gran Canaria
Tel: +34 928 292402
Fax: +34 928 291876
E-mail: commercial_lpa at viajeseci.es
Program Committee
-----------------
- Roberto Basili, Univ. Roma, Italy
- Olivier Bodenreider, National Library of Medicine, USA
- Tony Bryant, University of Leeds, United Kingdom
- Theresa Cabré, IULA-UPF, Spain
- Phil Edmonds, Sharp Laboratories of Europe LTD, United Kingdom
- Marc El-Bèze, Université d'Avignon et des Pays de Vaucluse, France
- Christian Fluhr, CEA, France
- Julio Gonzalo, Universidad Nacional de Educación a Distancia, Spain
- Natalia Grabar, AP-HP & INaLCO, France
- Thierry Hamon, LIPN, Université de Paris-Nord, France
- Graeme Hirst, University of Toronto, Canada
- John Humbley, Univiversité de Paris 7, France
- Nancy Ide, Vassar College, USA
- Adam Kilgarriff, University of Brighton, United Kingdom
- Marie-Claude L'Homme, Université de Montréal, Canada
- Claude de Loupy, Sinequa, France
- Christian Marest, Mediapps, France
- Adeline Nazarenko, LIPN, Université de Paris-Nord, France
- Patrick Paroubek, LIMSI, France
- Monique Slodzian, CRIM, INALCO, France
- Piek Vossen, Irion Technologies, The Netherlands
- Pierre Zweigenbaum, AP-HP, Université de Paris 6, France
Contact Person
--------------
Claude de Loupy
Sinequa
51-59 rue Ledru-Rollin
94200 Ivry-sur-Seine, France
Tel: +33 1 49 87 06 00 / Fax: +33 1 49 87 06 01
email: loupy at sinequa.com
--
Claude de Loupy - Head of Research
Sinequa - http://www.sinequa.com
Home page: http://www.langnat.com/~loupy (in French, sorry)
-------------------------------------------------------------------------
Message diffusé par la liste Langage Naturel <LN at cines.fr>
Informations, abonnement : http://www.biomath.jussieu.fr/LN/LN-F/
English version : http://www.biomath.jussieu.fr/LN/LN/
Archives : http://listserv.linguistlist.org/archives/ln.html
La liste LN est parrainée par l'ATALA (Association pour le Traitement
Automatique des Langues)
Information et adhésion : http://www.atala.org/
-------------------------------------------------------------------------
More information about the Ln
mailing list