Appel: Revue TAL, Ressources linguistiques libres

Thierry Hamon thierry.hamon at UNIV-PARIS13.FR
Wed Jun 8 20:52:21 UTC 2011


Date: Wed, 8 Jun 2011 09:09:32 +0200
From: Benoît Sagot <benoit.sagot at inria.fr>
Message-Id: <F58543E7-4291-4CE2-BFC5-4784761D5CD3 at inria.fr>


[english version follows]

CALL FOR PAPERS

Numéro spécial de la revue TAL (Traitement Automatique des Langues)
sur les "Ressources linguistiques libres"

Ces dernières années, les évolutions du domaine du TAL, tant dans ses
approches que dans ses ambitions, ont changé de façon importante les
paradigmes de conception, de construction, d'exploitation et
d'évaluation des ressources linguistiques. En particulier,
l'importance prise par les approches empiriques ont fait croître les
besoins en corpus annotés et en ressources lexicales.  Un nombre de
plus en plus important de langues, parmi lesquelles le français et les
autres langues romanes, se sont équipées de ressources de plus en plus
sophistiquées.

Les ressources linguistiques sont textuelles, orales, voire
multimodales. Elles regroupent :

- des corpus écrits ou oraux, bruts ou, plus naturellement, enrichis
  d'annotations de toute nature, de la simple étiquette
  morphosyntaxique à une information prosodique, et d'un graphe de
  dépendance à des structures de discours.

- des ressources lexicales relevant de l'un ou l'autre des niveaux
  d'analyse linguistique, mais également de grammaires ou d'autres
  formes de modélisation de tous types de structures linguistiques —
  la frontière entre lexique et grammaire dépend d'ailleurs souvent de
  l'approche (cf. TAG, lexique-grammaire, etc).

- des ressources complexes, combinant corpus annoté et base de donnée
  lexicale associée et/ou combinant des informations issues de
  différents niveaux d'analyse linguistique.

Elles rassemblent une ou plusieurs variantes de la langue ou des
langues traitées : langue standard, langue journalistique, langue de
spécialité (avec souvent une grande importance donnée aux aspects
terminologiques), langue orale (éventuellement transcrite), blogs et
forums, SMS, etc.


Toutefois, le développement de ressources linguistiques est une tâche
longue, coûteuse et fortement sujette aux erreurs, quelles que soient
les approches utilisées. C'est une des raisons de l'importance
croissante prise par les ressources libres dont l'exploitation et la
redistribution sont possibles tout en garantissant le maintien du
droit d'auteur lors de toute modification.


L'objectif de ce numéro spécial porte sur toutes les problématiques
scientifiques liées aux ressources linguistiques de toutes
natures. Au-delà de la simple description de ressources qui reste
souvent d'un intérêt limité, les soumissions attendues porteront sur
l'ensemble des thématiques liées aux ressources linguistiques, et
notamment:

- la modélisation des données linguistiques constituant les ressources
  : (cadres formels linguistiquement motivés, représentations
  d'informations linguistiques sous forme de données structurées et/ou
  quantitatives, normes pour les ressources linguistiques…).

- les méthodologies de développement de ressources linguistiques,
  qu'elles soient purement manuelles, purement automatiques ou
  hybrides (techniques semi-supervisées, méthodes par transfert
  interlingue, utilisation d'outils de pré-annotation, interfaces de
  validation/correction, etc.) ; les approches favorisant à la fois la
  pertinence linguistique et la minimisation du "coût humain" seront
  particulièrement appréciées.

- la validation et l'évaluation des ressources linguistiques, y
  compris au sein de systèmes de TAL mais également de linguistique
  expérimentale ; les contributions devront montrer en quoi
  l'utilisation de ressources linguistiques a permis d'améliorer les
  performances d'un système ou la compréhension d'un phénomène et/ou
  constituer un moyen pertinent d'évaluer voire d'améliorer ces
  ressources linguistiques.


Sont attendues en priorité des contributions en lien avec des
ressources linguistiques pour le français, ou, mieux encore, des
ressources multilingues dont l'une des langues est le français. Les
travaux concernant des ressources pour d'autres langues romanes sont
également pertinentes. Parallèlement, les contributions en lien avec
des ressources libres seront particulièrement appréciées.


Comité scientifique:

Nicolas Asher
Delphine Bernhard
Paul Buitelaar
Maria Teresa Cabré
Emmanuel Cartier
Anne Condamines
Benoît Crabbé
Cecile Fabre
Mikel Forcada
Gregory Grefenstette
Eva Hajicová
Nancy Ide
Christine Jacquin
Anne Lacheret
Marie-Claude L'Homme
Joseph Mariani
Piet Mertens
Asunción Moreno
Sophie Rosset
Agata Savary
Jesse Tseng
Agnès Tutin
Gertjan van Noord
Piek Vossen
Geoffrey Williams


Dates importantes

- Date limite de soumission: 30 September 2011

- Notification aux auteurs: 15 January 2012

- Date limite pour la version finale: 3 March 2012

- Publication en ligne: mid 2012



THE JOURNAL

Depuis 40 ans, TAL (Traitement Automatique des Langues) est un journal
international publié par l'ATALA (Association pour le Traitement
Automatique des Langues) avec le soutien du CNRS. Depuis quelques
années il s'agit d'un journal en ligne, des versions papier pouvant
être obtenues sur commande. Ceci n'affecte en rien le processus de
relecture et de sélection.



INFORMATIONS PRATIQUES

Les auteurs ayant l'intention de soumettre un article sont invités à
contacter les rédacteurs en chef invités de ce numéro: Benoît Sagot
(INRIA Paris Rocquencourt), benoit.sagot at inria.fr, et Núria Bel
(IULA, Universitat Pompeu Fabra, Barcelona), nuria.bel at upf.edu.

Les contributions (25 pages maximum, format PDF) devront être envoyées
par e-mail aux adresse suivantes : benoit.sagot at inria.fr et
nuria.bel at upf.edu.

Les feuilles de style sont disponibles sur le site web du journal:
http://www.atala.org/Instructions-aux-auteurs-feuilles

Le journal ne publie que des contributions originales, en français ou
en anglais.

Instructions aux auteurs:
http://www.atala.org/Instructions-aux-auteurs-feuilles

============================================

CALL FOR PAPERS

Special Issue of the TAL (Traitement Automatique des Langues / Natural
Language Processing) Journal on "Free Language Resources"

ATALA (French Association for Natural Language Processing) invites
authors to submit papers for the Special Issue on "Free Language
Resources".

Latest developments and applications in the field of Natural Language
Processing have significantly changed the paradigms for the design,
construction, operation and evaluation of, the so called, Language
Resources. In particular, the growing importance of empirical
approaches has raised the demand of corpora and lexica as major
sources of data on languages. An increasingly important number of
languages, including French and other Romance languages, are gradually
becoming equipped with new and richer resources.

Language Resources can be textual, oral or multimodal. They include:

- written or oral corpora, raw or, more interestingly, enriched with
  annotations of several kinds, which can range from morphosyntactic
  labels to prosodic information, from dependence graphs to discourse
  structure markup.

- lexical resources with information about one or more levels of
  linguistic analysis, and also grammars or other forms of modeling
  different types of language structures — the boundary between
  lexicon and grammar depends often on the approach (cf. TAG,
  lexicon-grammar, etc.).

- complex resources, combining an annotated corpus and an associated
  lexical database or combining information from different levels of
  linguistic analysis.


A language resource may involve one or more variants of the language
or languages covered: standard language, the language of journalism,
specialized language (often with great importance given to issues of
terminology), oral language (if transcribed), blogs and forums, SMS,
etc..


However, the development of language resources is a long, expensive
and highly error prone task regardless of the approaches used. This is
one of the reasons for the increasing importance of resources which
are freely available, so that authors and owners, while keeping the
authorship, allow for their exploitation, transformation and
redistribution.


The goal of this special issue is to focus on the full range of
scientific issues related to language resources that go beyond the
description of the resources by themselves. Thus, expected
contributions can cover all topics related to language resources,
including:

- Modeling of the language data that constitute the resource (both
  linguistically motivated formal frameworks, representation of
  linguistic information in the form of structured and/or quantitative
  data, standards for Language Resources ...)

- Methodologies for the development of Language Resources, either by
  hand, completely automatic or hybrid (semi-supervised techniques,
  interlingual transfer methods, use of pre-annotation tools,
  validation / correction interfaces, etc.), approaches promoting
  linguistic relevance while minimizing the "human cost" are most
  welcome.

- Methods for validation and evaluation of language resources
  including extrinsic evaluation within NLP systems and for
  experimental linguistic purposes. Contributions must show how the
  use of language resources has caused system performance
  improvements, better understanding of phenomenon and/or be a means
  to assess or improve these language resources.


Language Resources for French, or better multilingual resources or
language independent methods where French is one of the addressed
languages, are the main objective of this call. Works on resources for
other Romance languages are also relevant. In addition, contributions
related to free resources will be particularly appreciated.


Scientific Committee

Nicolas Asher
Delphine Bernhard
Paul Buitelaar
Maria Teresa Cabré
Emmanuel Cartier
Anne Condamines
Benoît Crabbé
Cecile Fabre
Mikel Forcada
Gregory Grefenstette
Eva Hajicová
Nancy Ide
Christine Jacquin
Anne Lacheret
Marie-Claude L'Homme
Joseph Mariani
Piet Mertens
Asunción Moreno
Sophie Rosset
Agata Savary
Jesse Tseng
Agnès Tutin
Gertjan van Noord
Piek Vossen
Geoffrey Williams


Important Dates

- Deadline for submission: 30 September 2011

- List of papers selected: 15 January 2012

- Deadline for camera ready papers: 3 March 2012

- Publication on line: mid 2012



THE JOURNAL

TAL (Traitement Automatique des Langues / Natural Language Processing)
is a forty year old international journal published by ATALA (French
Associationfor Natural Language Processing) with the support of CNRS
(National Centre for Scientific Research). It has moved to an
electronic mode of publication, with printing on demand. This affects
in no way its reviewing and selection process.



PRACTICAL ISSUES

Authors intending to submit a paper are encouraged to contact the
guest editors of the issue: Benoît Sagot (INRIA Paris Rocquencourt),
benoit.sagot at inria.fr, et Núria Bel(IULA, Universitat Pompeu Fabra,
Barcelona), nuria.bel at upf.edu.

Contributions (25 pages maximum, PDF format) must be sent by e-mail to
the addresses below : benoit.sagot at inria.fr and nuria.bel at
upf.edu.

Style sheets are available for download on the Web site of the
journal: http://www.atala.org/English-style-files.

The journal only publishes original contributions in French or in
English.

Check the instructions to authors:
http://www.atala.org/English-style-files.

-------------------------------------------------------------------------
Message diffuse par la liste Langage Naturel <LN at cines.fr>
Informations, abonnement : http://www.atala.org/article.php3?id_article=48
English version       : 
Archives                 : http://listserv.linguistlist.org/archives/ln.html
                                http://liste.cines.fr/info/ln

La liste LN est parrainee par l'ATALA (Association pour le Traitement
Automatique des Langues)
Information et adhesion  : http://www.atala.org/
-------------------------------------------------------------------------



More information about the Ln mailing list