Appel: Workshop Papillon 2002 on Lexical Databases

Alexis Nasr alexis.nasr at LINGUIST.JUSSIEU.FR
Tue Mar 12 19:29:56 UTC 2002


[English version below]


				Atelier PAPILLON-2002 Workshop

				sur les bases lexicales multilingues
				on Multilingual Lexical Databases

Tokyo, 16-18 juillet/July 2002

Annonce No3 / Announcement No3 11 March 2002
Lieu / Venue: NII, Hitotsubashi, Chiyoda-ku, Tokyo, Japan

 =======================================================================

				Présentation

Les bases lexicales multilingues sont des serveurs de données lexicales
structurées. Ces données peuvent être utilisées soit par des humains
pour définir leur propre dictionnaire soit par des applications de
traitement des langues.

Ces dernieres années, nous assistons à une accumulation de ressources
lexicales dans les laboratoires de traitement automatique de la langue
ainsi que sur Internet. les bases lexicales multilingues tentent de
résoudre ce problème d'accumulation en organisant la manipulation et
l'accès à ces ressources. Ces bases sont un point central de la
recherche dans les sciences du langage et dans le développement des
technologies de la langue. Comme les bases de données génomiques, les
bases lexicales sont complexes, évoluent, constituent des serveur
richement annotés et posent de difficiles problèmes scientifiques dans
de nombreux domaines.

Les buts de cet atelier sont de rendre compte de la recherche existante
dans les bases de données multilingues et d'identifier les problèmes
clés. Plus généralement, l'atelier aidera à definir des questions de
recherche de la nouvelle "communauté des bases lexicales multilingues"
autour de Papillon et initiera les échanges sur les problèmes en cours
et les résultats entre cette communauté et les autres communautés
(lexicographie, traduction, interfaces hommes-machine, bases de données
au sens large, etc.).

Papillon est un projet de construction et d'usage collaboratifs sur la
toile d'une base lexicale multilingue et de dictionnaires dérivés en
source ouverte (français, anglais, japonais, lao, thai et vietnamien)
L'atelier est destiné à des participants de plusieurs specialités
incluant les bases de données, la linguistique, la
linguistique-informatique, les annotations et XML.

L'atelier traitera une sélection des points suivants :

Structures

*  Microstructures des articles ou représentation lexicale
*  Macrostructures des dictionnaires et architecture générale
*  Modèles incluant la parole, les données multimodales, et les
metadonnées.

Données Lexicales

*  Standards de metadonnées fournissant de l'aide pour les bases
lexicales.
*  Méthodes systématiques pour peupler une base lexicale
*  Problèmes de récupération de dictionnaires
* Extraction de données mono et bilingues
*  Problèmes de traduction interne au dictionnaire

Bases de données

*  Support bases de données (par exemple quelle technologie de bases de
données standard est compatible avec les bases lexicales?)
*  Requetes d'annotations multicouches
*  Extensions du langage de requêtes XML (XQL)
*  Analyse des languages ad hoc existants
*  Méthodes d'indexation appropriées pour des chaînes linguistiques
  et des structures d'archivage.

Autres sujets

*  Ergonomie, Interfaces, protocoles d'accès aux données
*  Gestion sociale du dictionnaire


------------------------------------------------------------------------
				Overview

Multilingual lexical databases are repositories of structured
information to provide an easy access to all available meanings of words
and to allow the creation of a number of computer programs that will
help to analyze texts using these datatabases.

Multilingual lexical databases are repositories of structured lexical
data. This data can be used either by humans to derive their own
dictionary, either by NLP applications.

Over the last decade, we assist to an accumulation of lexical resources
in NLP laboratories and on the Internet. The lexical databases try to
solve this accumulation problem by organizing the manipulation and the
access to these resources. These databases are a central point of
research in the language sciences, and in the development of new human
language technologies. Like genomic databases, lexical databases are
complex, evolving and richly annotated repositories, and pose
interesting challenges for efficient representation, indexing and query.

The goals of the workshop are to take stock of existing research in
multilingual lexical databases and to identify the key problems. More
broadly, the workshop will help define the research questions of the new
Papillon "multilingual lexical database community" and initiate the
interchange of relevant ongoing problems and results between this
community and other communities (lexicography, translation,
human-computer interactions, database community at large).

Papillon is a project of construction and collaborative usage on the web
of a multilingual lexical database and electronic dictionaries derived
in open source (French, English, Japanese, Thai, Lao, vietnamese) The
workshop is expected to attract participants from a range of specialties
including databases, linguistics, computational linguistics, annotation
and markup.

The workshop will address a selection of the following topics:

Structures

*  Microstructures of the Entries and Lexical Representation
*  General Architecture and Macrostructure of the Dictionary
*  Models for lexical databases including speech, multimodal
data, and metadata.

Lexical Data

*  Metadata standards serving as finding aids for lexical database,
*  Systematic methods for populating lexical databases,
*  Dictionary recuperation Issues,
*  Monolingual data and bilingual data extraction,
*  Dictionary Internal Translation Issues.

Databases

*  Database support (e.g. what standard database technology has proven
worthwhile for lexical databases?)
*  Query of multilayer annotations
*  Extensions of XML query languages
*  Analysis of existing ad hoc query languages
*  Appropriate indexing methods for linguistic strings and
structures archiving.

Other Topics

*  Ergonomy, Interface and acces protocol to the Lexical data
*  Lexical database social issues


 =======================================================================

				Programme

Le programme sera varié et prévu pour maximiser la coopération entre les
spécialités, et pour permettre des discussions ouvertes étendues.
Les composantes du programme seront entre autres :

*  Des ateliers sur les différents modèles et structures linguistiques
et lexicales par exemple, la structure des articles monolingues, les
langages de requêtes semi-structurés;
*  Des sessions de posters sur des lexiques et textes annotés
  (et peut être d'autres);
*  Des présentations de papiers rapportant des nouvelles recherches;
*  Des démonstrations de systèmes pour créer et gérer les données
lexicales.

------------------------------------------------------------------------

  				Program

The program will have a varied format, designed to maximize
cross-fertilization among the various specialties, and to allow extended
open discussion.
Components of the program will include:

*  Tutorials on relevant models from linguistics, databases or
annotation, e.g. the structure of lexical entries and semi-structured
query languages;
*  Panel sessions on annotated text and lexicons (and possibly others);
*  Paper presentations reporting new research;
* Demonstrations of systems for creating and/or managing lexical data.


 =======================================================================

				DATES IMPORTANTES /IMPORTANT DATES

* 2002/04/31 Date limite de soumission / Submission Deadline
* 2002/05/20 Notification d'acceptation / Notice of Acceptance
* 2002/06/15 Version finale / Camera Ready Papers
* 2002/07/15 Arrivée conseillée / Advised Arrival
*  2002/07/18 Fin / end


 =======================================================================

				Appel à communications

Les papiers techniques sur les aspects informatiques (développement du
serveur web, utilisation d'une base de données, développement
d'interfaces, etc.), les aspects linguistiques (microstructure commune
monolingue, problèmes spécifiques aux langues, manuels d'encodage, etc.)
ainsi que les aspects sociaux (comment motiver les contributeurs,
comment agrandir la communauté, etc. ) sont tous bienvenus.

Envoyez vos papiers complets aux formats rtf, pdf, ps, html à l'adresse
suivante : mailto:mangeot at nii.ac.jp

Nous vous conseillons fortement d'utiliser le modèle de Springer Verlag
disponible à l'adresse suivante :
http://www.springer.de/comp/lncs/authors.html

------------------------------------------------------------------------
				Call for Papers

Technical papers about computer related aspects (development of the web
server, use of a database, development of interfaces, etc.), linguistic
aspects (monolingual common microstructure, language specific encoding
problems, best practice, etc.) as well as social aspects (how to open
the community, how to motivate the contributors) are all welcomed.

Please send your complete papers in rtf, pdf, ps or html formats to the
following address: mailto:mangeot at nii.ac.jp

We strongly recommend you to use the Springer Verlag template available
at the following address: http://www.springer.de/comp/lncs/authors.html


 =======================================================================

				Comité d'organisation local / Local Organizing
Committee

President Mathieu Mangeot, NII, Tokyo

*  Frederic Andrès, NII, Tokyo
*  David Thévenin, NII, Tokyo
*  Shiho Kurosawa, NII, Tokyo


 =======================================================================

				Comité de programme / Program Committee

President Christian Boitet, GETA-CLIPS, Grenoble

*  Mr. Frederic Andrès, NII,Tokyo
*  Mr. François Brown de Colstoun, Ambassade de France, Tokyo
*  Ms. Françoise Guelle, Ambassade de France, Tokyo
*  Mr. Kyo Kageura, NII,Tokyo
*  Ms. Asanee Kawtrakul, KU, Bangkok
*  Mr. Mathieu Lafourcade,LIRMM, Montpellier
*  Mr. Francois Lareau, Université de Montréal, Montreal
*  Mr. Mathieu Mangeot, NII,Tokyo
*  Mr. Emmanuel Planas, GETA-CLIPS, Grenoble
*  Mr. Alain Polguère, Université de Montréal, Montreal
*  Mr. Gilles Sérasset, GETA-CLIPS, Grenoble
*  Ms. Kumiko Tanaka Ishii, Tokyo University, Tokyo
*  Mr. David Thévenin, NII, Tokyo
*  Ms. Mutsuko Tomokiyo, GETA-CLIPS, Grenoble
*  Mr. Michael Zock, LIMSI, Orsay


Informations diverses / Miscellaneous Information

*  NII: http://www.nii.ac.jp
*  CLIPS: http://www-clips.imag.fr/
*  Papillon: http://www.papillon-dictionary.org/
*  E-mail list manager: mailto:mangeot at nii.ac.jp
-------------------------------------------------------------------------
Message diffusé par la liste Langage Naturel <LN at cines.fr>
Informations, abonnement : http://www.biomath.jussieu.fr/LN/LN-F/
English version          : http://www.biomath.jussieu.fr/LN/LN/
Archives                 : http://listserv.linguistlist.org/archives/ln.html

La liste LN est parrainée par l'ATALA (Association pour le Traitement
Automatique des Langues)
Information et adhésion  : http://www.atala.org/
-------------------------------------------------------------------------



More information about the Ln mailing list