[ln] Appel: Workshop NLP for Under-Resourced Languages, TALN 2005

Thierry Hamon thierry.hamon at LIPN.UNIV-PARIS13.FR
Tue Jan 25 10:41:31 UTC 2005


Date: Mon, 24 Jan 2005 15:18:32 +0100 (CET)
From: "Chantal ENGUEHARD" <Chantal.Enguehard at univ-nantes.fr>
Message-ID: <62940.193.251.227.210.1106576312.squirrel at 193.251.227.210>
X-url: http://www.limsi.fr/TALN05


===========================================
    CALL FOR PAPERS for the Workshop

    NLP for Under-Resourced Languages

          Friday, 10 June 2005

         in Dourdan, near Paris
============================================

Held in conjunction with the conference
TALN 2005 (6-10 June 2005)
http://www.limsi.fr/TALN05

Many languages have little or no information technology available:
they have no substantial presence on the Internet, and existing
software has not been adapted for their use.  These are languages of
countries in the developing world (e.g. Wolof in Senegal), or regional
languages in countries where the first language is a global one
(e.g. Breton in France).

Linguistic work on these languages is often lacking, and must overcome
a number of difficulties:
- the presence of many lexical alternatives
- multiple spellings for the same word,
- the lack of exhaustive lexicons,
- non-standardized transcription methods
- etc.

This is why we describe these languages as "under-resourced" or
"pi-languages": for political and economic reasons they lack
sufficient resources in terms of both linguistic study and information
technology.

The goal of this workshop is to provide a progress report on
techniques being used for Natural Language Processing of
under-resourced languages.

THEMES

Researchers are invited to present work  related to any of the following topics:

- Methods for measuring the level of technology available for a given
  language

- Assessment of resources for basic computerization, and
  standardization of these resources (editors, virtual keyboards,
  printing, sorting, etc.)

- Collection of corpora and other linguistic resources (lexicons,
  grammars); the role of the Internet, diasporas, unsupervised
  training algorithms

- Methodologies for computerization of under-resourced languages
  (details of techniques)

- Specific technologies (OCR, PDA)

- Encoding of linguistic data (lexicons, morphology, syntax, and
  semantics) and genericity of formats.

- Reports concerning the computerization of a particular language or
  group of pi-languages.

- Architectures for NLP technologies : adaptation of existing
  technologies to pi-languages.

- Surveys of major problems encountered in this area.

SELECTION CRITERIA
------------------------------
Authors are invited to submit papers concerning original research.
All submissions will be examined by at least two specialists in the
area.  Particular attention will be paid to:

- appropriateness for the themes of the workshop
- importance and originality of the contribution
- validity of the technical and scientific content
- critical discussion of the results, in particular as they relate to
  other work in the field
- organization and clarity of the presentation

The selected articles will be published in the conference proceedings.


METHODS OF SUBMISSION
------------------------------
* Submitted articles may not exceed 10 pages in Times 12,
single-spaced (about 3000 words), figures, examples, and references
included.
Articles are to be written in French for French speakers and in
English for non-French speakers.


* A LaTeX style file and Word template file will be available from the
conference web site http://www.limsi.fr/TALN05.

* Articles must be submitted as an attachment to an email with the
subject "atelier TALN soumission" and containing the title of the
article, principal author's name, affiliation, postal address, email
address, telephone number, and fax number.  Send this email to
chantal.enguehard@ univ-nantes.fr.

* It is IMPERATIVE that one of the following file formats be used,
formatted for A4 paper: PS, PDF, RTF (Word).

* In case an email submission is not possible, paper submissions may
be accepted.  Send 3 paper copies of the article to the following
address:

Chantal Enguehard - TALN 2005
LINA
2, rue de la Houssinière
BP 92208
44322 Nantes Cedex 03
France

CALENDAR

Submission deadline: Thursday, 10 March 2005
Notification to authors: Tuesday, 5 April 2005
Final version: Friday, 15 April 2005
Conference : Friday, 10 June 2005

PROGRAM COMMITTEE

. Denis Béchet - Laboratoire d'Informatique Nantes-Atlantique
. Vincent Berment - Laboratoire Communication Langagière et
  Interaction Personne-Système
. Christian Boitet - Laboratoire Communication Langagière et
  Interaction Personne-Système
. Malek Boualem - France Telecom
. Marcel Diki-Kidiri - Langage, Langues et Cultures d'Afrique Noire
. Chantal Enguehard - Laboratoire d'Informatique Nantes-Atlantique
  (President)
. Laura Monceaux - Laboratoire d'Informatique Nantes-Atlantique
. Kevin Scannell - Saint Louis University
. Monique Slodzian - Centre de Recherche en Ingénierie Multilingue


============================================
   APPEL A COMMUNICATIONS de l’atelier

        TAL et langues peu dotées

          vendredi 10 juin 2005

     à Dourdan en région parisienne
============================================

Dans le cadre de TALN 2005 (6 au 10 juin 2005)
http://www.limsi.fr/TALN05


De nombreuses langues n'ont pas franchi l'étape de l'informatisation :
elles sont peu présentes sur Internet, les logiciels existants ne sont
pas adaptés. Il s'agit de langues de pays en voie de développement
(comme le wolof au Sénégal par exemple), ou bien de langues régionales
dans des pays où la langue officielle est une langue de dimension
internationale (le breton en France).
Ces langues souffrent souvent de lacunes dans les travaux
linguistiques qui leur sont consacrés et doivent faire face à diverses
difficultés :

- présence de nombreuses variantes lexicales,
- graphies concurrentes pour un même mot,
- inexistence de lexiques exhaustifs,
- transcription non complètement standardisée
- etc.
C’est pourquoi nous qualifions ces langues de « peu dotées » ou «
langues-pi » : elles sont à la fois peu informatisées et peu étudiées,
que ce soit pour des raisons politiques ou économiques.

Cet atelier vise à faire le point sur les méthodes à adopter pour
développer le Traitement Automatique des Langues pour des langues peu
dotées.

THEMES
Les chercheurs seront invités à présenter des communications autour
des thèmes suivants :
- Méthodes de mesure du niveau d'informatisation d'une langue.
- Bilan des solutions apportées en informatisation de base,
  standardisation de ces solutions (éditeurs, claviers virtuels,
  impression , tri lexicographique etc.).
- Recueil de corpus et de ressources langagières (lexiques,
  grammaires) : rôle d'Internet et des diasporas, apport des algorithmes
  d’apprentissage.
- Méthodologie d'informatisation pour les langues-pi (spécificité des
  techniques d'informatisation).
- Technologies d'actualité (ROC ou PDA).
- Modélisation des données linguistiques (lexiques, morphologie,
  syntaxe et sémantique) et généricité des formats adoptés.
- Rapports d'expériences sur l'informatisation d'une langue ou d'un
  groupe de langues-pi.
- Architectures des technologies de TALN : adaptation des technologies
  existantes aux langues-pi.
- Panorama des grands types de problèmes linguistiques rencontrés lors
  du traitement automatique de langues-pi.

CRITERES DE SÉLECTION
------------------------------

Les auteurs sont invités à soumettre des travaux de recherche
originaux.
Les soumissions seront examinées par au moins deux spécialistes du
domaine.  Seront considérées en particulier:

- l'adéquation à la thématique de l’atelier.
- l'importance et l'originalité de la contribution,
- la correction du contenu scientifique et technique,
- la discussion critique des résultats, en particulier par rapport aux
  autres travaux du domaine,
- l'organisation et la clarté de la présentation,

Les articles sélectionnés seront publiés dans les actes de la
conférence.

MODALITÉS DE SOUMISSION
-----------------------------------

* Les articles soumis ne devront pas dépasser 10 pages en Times 12,
espacement simple, soit environ 3000 mots, figures, exemples et
références compris. Les articles seront rédigés en français pour les
francophones, en anglais pour les non-francophones.

* Une feuille de style LaTeX et un modèle Word seront disponibles sur
le site web de la conférence http://www.limsi.fr/TALN05.

* Les auteurs devront envoyer leur soumission sous la forme d'un
document attaché à un courrier électronique ayant pour titre "atelier
TALN soumission" et contenant le titre de la communication, le nom,
l'affiliation, l'adresse postale, l'adresse électronique, le numéro de
téléphone et le fax de l'auteur principal.  Adresser ce courrier à
chantal.enguehard at univ-nantes.fr

* L'un des formats suivants devra IMPÉRATIVEMENT être employé : PS,
PDF, RTF (Word).  Les versions devront être au format A4.

* En cas d'impossibilité d'envoi par courrier électronique, une
soumission "papier" pourra être admise. 3 exemplaires papier de la
contribution devront être envoyés à l'adresse suivante:

     Chantal Enguehard -  TALN 2005
     LINA
     2, rue de la Houssinière
     BP 92208
     44322 Nantes Cedex 03
     France


CALENDRIER

Date limite de soumission : jeudi 10 mars 2005
Notification aux auteurs : mardi 5 avril 2005
Version finale : vendredi 15 avril 2005
Conférence : vendredi 10 juin 2005


COMITE DE PROGRAMME

. Denis Béchet - Laboratoire d’Informatique Nantes-Atlantique
. Vincent Berment - Laboratoire Communication Langagière et
  Interaction Personne-Système
. Christian Boitet - Laboratoire Communication Langagière et
  Interaction Personne-Système
. Malek Boualem - France Telecom
. Marcel Diki-Kidiri - Langage, Langues et Cultures d’Afrique Noire
. Chantal Enguehard - Laboratoire d’Informatique Nantes-Atlantique
  (Présidente)
. Laura Monceaux - Laboratoire d’Informatique Nantes-Atlantique
. Kevin Scannell - Saint Louis University
. Monique Slodzian - Centre de Recherche en Ingénierie Multilingue

-------------------------------------------------------------------------
Message diffusé par la liste Langage Naturel <LN at cines.fr>
Informations, abonnement : http://www.biomath.jussieu.fr/LN/LN-F/
English version          : http://www.biomath.jussieu.fr/LN/LN/
Archives                 : http://listserv.linguistlist.org/archives/ln.html

La liste LN est parrainée par l'ATALA (Association pour le Traitement
Automatique des Langues)
Information et adhésion  : http://www.atala.org/
-------------------------------------------------------------------------



More information about the Ln mailing list