Appel: PAPILLON 2005

Thierry Hamon thierry.hamon at LIPN.UNIV-PARIS13.FR
Wed Jul 13 16:13:22 UTC 2005


Date: Tue, 12 Jul 2005 11:15:29 +0200
From: lafourcade <lafourca at lirmm.fr>
Message-Id: <7DB8DD46-F2B5-11D9-BFC6-000393585F2E at lirmm.fr>
X-url: http://naist.cpe.ku.ac.th/papillon_2005/
X-url: http://www.springer.de/comp/lncs/authors.html
X-url: http://naist.cpe.ku.ac.th/papillon_2005/
X-url: http://www.papillon-dictionary.org/
X-url: http://www.lirmm.fr/

------------------------------------------------------------------------ 
------------------------------------------------------------------------

***English version below***

http://naist.cpe.ku.ac.th/papillon_2005/

------------------------------------
Appel à communication (PAPILLON 2005)

Atelier PAPILLON-2005
sur les bases lexicales multilingues
Thaïlande, 12 et 14 août 2005
------------------------------------

En parallèle avec SNLP 2005 - Chiang Rai

12 décembre à Bangkok
14 décembre à Chiang Rai

Lieu : Bangkok et Chiang Rai, Thaïlande
Date limite de soumission 31 août 2005

PRESENTATION

Les bases lexicales multilingues sont des (i) serveurs de base de (ii)
données lexicales structurées dont les données peuvent être utilisées
(iii) soit par des humains pour définir leur propre dictionnaire (iv)
soit par des applications de traitement automatique des langues (TAL).
Ces bases deviennent incontournables dans les sciences du langage pour
le développement des technologies de la langue. A l'instar des bases
de données génomiques, les bases lexicales constituent des serveurs
richement annotés. Elles sont complexes et sujettes à évolution.

Papillon est un projet de collaboration, par l'intermédiaire de la
Toile, pour la construction et l'usage d'une base lexicale multilingue
en source ouverte (français, allemand, anglais, japonais, lao, malais,
thaï et vietnamien). Cette base devra contenir assez d'information
pour être utilisée aussi bien par des humains pour consultation,
production de dictionnaires dérivés personnalisés, ou apprentissage
des langues, que par des programmes de traitement automatique des
langues en vue d'extraction automatique d'ensembles de données ou
d'exploitation directe de données ponctuelles.

Papillon-2005, sixième édition d'un atelier annuel organisé par les
membres du projet, a pour but d'identifier les problèmes qui se posent
à la nouvelle "communauté des bases lexicales multilingues". Il vise à
promouvoir les échanges entre spécialistes de plusieurs
communautés. Il est donc ouvert à des participants de toute specialité
relative aux bases lexicales : bases de données, interfaces
hommes-machine de consultation de dictionnaires annotation, XML,
standardisation de dictionnaires ou de données lexicales ;
lexicographie, traduction, linguistique informatique ; etc. L'atelier
se veut ouvert et encourage particulièrement les contributions de
chercheurs extérieurs au projet Papillon.

L'atelier "Papillon 2005" encourage les contributions portant sur les
points généraux suivants :
(i) Aspect : bases de données

     * Macrostructures des dictionnaires et architecture générale
     * Bases de données et bases lexicales : divergences et points  
communs
     * Langages de requêtes (XML, XQL, etc.)
     * Méthodes d'indexation efficaces et archivage
     * Normes pour les bases lexicales

(ii) Aspect : données lexicales

     * Microstructures d'entrées lexicales et particularités  
linguistiques
     * Récupération et production automatique de dictionnaires
     * Enrichissement automatique de bases lexicales
     * Internationalisation/localisation de données lexicales  
multilingues
     * Intégration de données multimodales et métadonnées
     * Interactions entres données lexicales et données linguistiques  
(corpus, bases d'exemples, illustrations, etc.)
     * Interaction grammaire-lexique

(iii) Aspect : utilisation humaine

     * Nouvelles formes de consultation de données lexicales
     * Interfaces d'interrogation de dictionnaires, ergonomie
     * Aspects légaux relatifs aux dictionnaires (copyright, etc.)
     * Adéquation/inadéquation de dictionnaires existants à certains  
usagers

(iv) Aspect : usage en TAL

     * Systèmes de TAL utilisant des bases de données lexicales
     * Exploitation directe de dictionnaires par des systémes de TAL
     * Construction de données lexicales pour des systèmes particuliers
     * Interchangeabilité de données lexicales
     * Neutralité des systèmes vis-à-vis des données lexicales

L'atelier accueillera aussi des contributions plus spécifiques au  
projet Papillon :
Théorie sens-texte et lexicographie

     * Problèmes linguistiques
     * Ecriture de la formule sémantique des lexies
     * Problèmes pratiques de description d'entrées
     * Exemples de lexies ou d'axies

Proposition de collaboration à Papillon

     * Interfaces d'interrogation
     * Automatisation de l'indexation
     * Enrichissement du paradis, du purgatoire, des limbes

Résultat de collaboration à Papillon

     * Apport de données au paradis, au purgatoire, aux limbes
     * Attractivité du site web de Papillon

Travail collaboratif

     * Méthodes/Services pour le travail lexical collaboratif
     * Motivations des contributeurs volontaires
     * Reconnaissance et tracabilité du travail fourni

Les contributions attendues feront au plus 10 pages.

PROGRAMME

Le programme sera varié et prévu pour maximiser la coopération entre  
les spécialités, et pour permettre des discussions ouvertes étendues.  
Les composantes du programme seront entre autres :

     * Des ateliers sur les différents modèles et structures  
linguistiques et lexicales par exemple, la structure des articles  
monolingues, les langages de requêtes semi-structurés;
     * Des sessions de posters sur des lexiques et textes annotés (et  
peut être d'autres);
     * Des présentations de papiers rapportant des nouvelles recherches;
     * Des démonstrations de systèmes pour créer et gérer les données  
lexicales.

DATES IMPORTANTES

     * Date limite de soumission: 31 août 2005
     * Notification d'acceptation: 15 octobre 2005
     * Version finale: 15 novembre 2005

APPEL A COMMUNICATIONS

Les contributions devront être envoyées après compression avec zip ou  
gzip par courrier électronique à l'adresse :  
mailto:papillon2005_submission at lirmm.fr.

Elles consisteront en un papier complet, de 10 pages maximum
(bibliographies, illustration et équations comprises) rédigé en
anglais au format PDF uniquement. Prière d'inclure les polices
utilisées dans votre document PDF s'il utilise des caractères
accentués ou des polices de caractères non latines. Vous pouvez
vérifier que votre fichier PDF est correct en désactivant le menu
"Utiliser les Polices locales" lorsque vous visualisez votre document
avec Adobe Acrobat Reader.

Pour convertir des documents Word, vous pouvez utiliser, par exemple,  
les outils proposés sur les sites suivants : CRI74 ou CERN.

Nous vous conseillons fortement d'utiliser le modèle de Springer
Verlag disponible à l'adresse suivante :
http://www.springer.de/comp/lncs/authors.html

COMITE D'ORGANISATION LOCAL

Président : Me. Asanee Kawtrakul, Kasetsart University, Bangkok,  
Thailand

     * Me. Mukda Suktarachan (mukda at vivaldi.cpe.ku.ac.th)
     * Mr.Worapoj Peerawit
     * ...

COMITE DE PROGRAMME

Président : Mr. Mathieu Lafourcade, LIRMM, Montpellier, France

     * Mr. Christian Boitet, GETA-CLIPS-IMAG, Grenoble, France
     * Mr. Francis Bond, NTT, Keihanna, Japon
     * Mr. Jacques Chauché, LIRMM, Montpellier, France.
     * Ms. Chuah Choy Kim, Malaysia.
     * Mr. Jim Breen, Université Monash, Australie
     * Mr. François Brown de Colstoun, INRIA, Rocquencourt, France
     * Ms. Asanee Kawtrakul, Université Kasetsart, Bangkok, Thaïlande
     * Mr. Mathieu Lafourcade, LIRMM, Montpellier, France
     * Mr. Yves Lepage, ATR, Keihanna, Japon
     * Mr. Emmanuel Planas, GETA-CLIPS-IMAG, Grenoble, France
     * Mr. Alain Polguère, OLST, Université de Montréal, Montreal, France
     * Me. Violaine Prince, LIRMM, Montpellier, France
     * Mr. Gilles Sérasset, GETA-CLIPS-IMAG, Grenoble, France
     * Mr. Michael Zock, LIMSI, Orsay, France

INFORMATIONS DIVERSES

     * Site web de Papillon 2005 :  http://naist.cpe.ku.ac.th/papillon_2005/
     * Site web du projet Papillon : http://www.papillon-dictionary.org/
     * LIRMM : http://www.lirmm.fr/




------------------------------------
Call for Papers (PAPILLON 2005)

PAPILLON-2005 Workshop
on Multilingual Lexical Databases
Thaïland, 12th and 14th December, 2005
------------------------------------

In parallel with SNLP 2005 - Chiang Rai

12th December at Bangkok
14th December at Chiang Rai

Venue: Bangkok and Chiang Rai, Thaïlande
Submission deadline August, 31st 2005

OVERVIEW

Multilingual lexical databases are (i) databases for (ii) structured  
lexical data which can be used either (iii) by humans e.g. to define  
their own dictionaries or (iv) by natural language processing (NLP)  
applications. Such databases are now felt indispensable in language  
science with the advances of language engineering. Like databases in  
genomics, multilingual lexical databases need rich annotations; they  
are complex, and they evolve as time goes by.

The Papillon project is a Web collaborative project with the aim to  
build an open source multilingual lexical database for several  
languages (French, German, English, Japanese, Lao, Malay, Thai and  
Vietnamese). The provided lexical information has to be rich enough for  
a human to be able to query and generate his/her own tailored  
dictionary (e.g. for language learning or for translation work) and for  
NLP applications to be able to extract a whole range of data or to  
directly exploit some particular data.

The 2004 Papillon workshop, the fifth in a series of workshops  
organized every year by the Papillon members, will aim at identifying  
problems relevant to the multilingual-lexical-database community. The  
workshop aims to promote exchanges between practitioners from several  
fields and is thus open to anybody working in a domain pertaining to  
lexical databases such as: databases, man-machine interface for  
dictionaries, data annotation, XML, standardization of dictionaries or  
lexical data; lexicography, translation, computational linguistics,  
etc. This workshop is open and particularly encourages submissions by  
researchers from outside the Papillon project.

The "Papillon 2004" workshop particularly welcomes general submissions  
on the following topics:
(i) Aspect: databases

     * Macrostructures for dictionaries and general architecture
     * Databases and lexical databases: differences and similarities
     * Query languages (XML, XQL, etc.)
     * Fast indexes and archiving techniques
     * Standards for lexical databases

(ii) Aspect: lexical data

     * Microstructures of lexical entries and linguistic specifications
     * Reuse or automatic production of dictionaries
     * Automatic feeding of lexical databases
     * Internationalization/localization of multilingual lexical data
     * Integration of multimodal information and meta-information
     * Interaction between lexical data and linguistic data (corpora,  
examples, illustrations, etc.)
     * Interaction between grammar and lexicon

(iii) Aspect: human use

     * New ways of dictionary lookup
     * Interfaces for querying dictionaries, user-friendliness
     * Legal aspects of dictionaries (copyright, etc.)
     * Adequation/inadequation of existing distionnary to certain users

(iv) Aspect: NLP use

     * NLP systems using lexical databases
     * Direct use of dictionaries in NLP systems
     * Building lexical data sets for specific applications
     * Interchangeability of lexical data
     * Neutrality of NLP systems with regard to lexical data

The workshop will also accept submission on aspects more specific to  
the Papillon project
Meaning-text theory and lexicography

     * Linguistic problems
     * Composing semantic formulae for lexies
     * Practical problems in indexing specifing entries/lexies
     * Examples of lexies or axies

Proposals for collaboration with the Papillon project

     * Query interfaces
     * Automatic Indexing
     * Contribution to the paradise, the purgatory, or the limbo

Summary/state of collaboration to the Papillon project

     * Contribution to the paradise, the purgatory, or the limbo
     * Attractiveness of the Papillon Web site

Collaborative work

     * Methods/services for lexical collaborative work
     * Motivations for voluntary contributers
     * Recognition and traceability of contributed work

Contributions should not exceed 10 pages.

PROGRAM

The program will have a varied format, designed to maximize  
cross-fertilization among the various specialties, and to allow  
extended open discussion. Components of the program will include:

     * Tutorials on relevant models from linguistics, databases or  
annotation, e.g. the structure of lexical entries and semi-structured  
query languages;
     * Panel sessions on annotated text and lexicons (and possibly  
others);
     * Paper presentations reporting new research;
     * Demonstrations of systems for creating and/or managing lexical  
data.

IMPORTANT DATES

     * Submission Deadline: 31th August 2005
     * Notificationof Acceptance: 15th october 2005
     * Camera Ready Papers: 15th november 2005

CALL FOR PAPERS

Submissions will be sent after compression with zip or gzip by  
electronic mail to: mailto:papillon2005_submission at lirmm.fr.

They will consist in a full paper, of max. 10 pages (inclusive of  
references, tables, figures and equations) written in english in PDF  
format only. Do not forget to include fonts in your PDF document if you  
use non-English characters. You can check that your file is correct by  
disabling the "Use Local Font" option when viewing you PDF document  
with Adobe Reader.

For conversion from proprietary format into PDF, see e.g. the CRI74 or  
the CERN conversion facilities.

We strongly recommend you to use the Springer Verlag template available  
at the following address: http://www.springer.de/comp/lncs/authors.html


LOCAL ORGANIZING COMMITTEE

President: Me. Asanee Kawtrakul, Kasetsart University, Bangkok, Thailand

     * Ms. Mukda Suktarachan (mukda at vivaldi.cpe.ku.ac.th)
     * Mr.Worapoj Peerawit
     * ...

PROGRAM COMMITTEE

President: Mr. Mathieu Lafourcade, LIRMM, Montpellier, France

     * Mr. Christian Boitet, GETA-CLIPS-IMAG, Grenoble, France
     * Mr. Francis Bond, NTT, Keihanna, Japon
     * Mr. Jacques Chauché, LIRMM, Montpellier, France.
     * Ms. Chuah Choy Kim, Malaysia.
     * Mr. Jim Breen, Université Monash, Australie
     * Mr. François Brown de Colstoun, INRIA, Rocquencourt, France
     * Ms. Asanee Kawtrakul, Université Kasetsart, Bangkok, Thaïlande
     * Mr. Mathieu Lafourcade, LIRMM, Montpellier, France
     * Mr. Yves Lepage, ATR, Keihanna, Japon
     * Mr. Emmanuel Planas, GETA-CLIPS-IMAG, Grenoble, France
     * Mr. Alain Polguère, OLST, Université de Montréal, Montreal, France
     * Me. Violaine Prince, LIRMM, Montpellier, France
     * Mr. Gilles Sérasset, GETA-CLIPS-IMAG, Grenoble, France
     * Mr. Michael Zock, LIMSI, Orsay, France


MISCELLANEOUS INFORMATION

     * Papillon 2005 web site: http://naist.cpe.ku.ac.th/papillon_2005/
     * Papillon project Web site: http://www.papillon-dictionary.org/
     * LIRMM: http://www.lirmm.fr/


------------------------------------------------------------------------ 
------------------------------------------------------------------------

-------------------------------------------------------------------------
Message diffusé par la liste Langage Naturel <LN at cines.fr>
Informations, abonnement : http://www.biomath.jussieu.fr/LN/LN-F/
English version          : http://www.biomath.jussieu.fr/LN/LN/
Archives                 : http://listserv.linguistlist.org/archives/ln.html

La liste LN est parrainée par l'ATALA (Association pour le Traitement
Automatique des Langues)
Information et adhésion  : http://www.atala.org/
-------------------------------------------------------------------------



More information about the Ln mailing list