Appel: Revue TAL, Ressources linguistiques libres
Thierry Hamon
thierry.hamon at UNIV-PARIS13.FR
Wed Jun 8 20:52:21 UTC 2011
Date: Wed, 8 Jun 2011 09:09:32 +0200
From: Benoît Sagot <benoit.sagot at inria.fr>
Message-Id: <F58543E7-4291-4CE2-BFC5-4784761D5CD3 at inria.fr>
[english version follows]
CALL FOR PAPERS
Numéro spécial de la revue TAL (Traitement Automatique des Langues)
sur les "Ressources linguistiques libres"
Ces dernières années, les évolutions du domaine du TAL, tant dans ses
approches que dans ses ambitions, ont changé de façon importante les
paradigmes de conception, de construction, d'exploitation et
d'évaluation des ressources linguistiques. En particulier,
l'importance prise par les approches empiriques ont fait croître les
besoins en corpus annotés et en ressources lexicales. Un nombre de
plus en plus important de langues, parmi lesquelles le français et les
autres langues romanes, se sont équipées de ressources de plus en plus
sophistiquées.
Les ressources linguistiques sont textuelles, orales, voire
multimodales. Elles regroupent :
- des corpus écrits ou oraux, bruts ou, plus naturellement, enrichis
d'annotations de toute nature, de la simple étiquette
morphosyntaxique à une information prosodique, et d'un graphe de
dépendance à des structures de discours.
- des ressources lexicales relevant de l'un ou l'autre des niveaux
d'analyse linguistique, mais également de grammaires ou d'autres
formes de modélisation de tous types de structures linguistiques —
la frontière entre lexique et grammaire dépend d'ailleurs souvent de
l'approche (cf. TAG, lexique-grammaire, etc).
- des ressources complexes, combinant corpus annoté et base de donnée
lexicale associée et/ou combinant des informations issues de
différents niveaux d'analyse linguistique.
Elles rassemblent une ou plusieurs variantes de la langue ou des
langues traitées : langue standard, langue journalistique, langue de
spécialité (avec souvent une grande importance donnée aux aspects
terminologiques), langue orale (éventuellement transcrite), blogs et
forums, SMS, etc.
Toutefois, le développement de ressources linguistiques est une tâche
longue, coûteuse et fortement sujette aux erreurs, quelles que soient
les approches utilisées. C'est une des raisons de l'importance
croissante prise par les ressources libres dont l'exploitation et la
redistribution sont possibles tout en garantissant le maintien du
droit d'auteur lors de toute modification.
L'objectif de ce numéro spécial porte sur toutes les problématiques
scientifiques liées aux ressources linguistiques de toutes
natures. Au-delà de la simple description de ressources qui reste
souvent d'un intérêt limité, les soumissions attendues porteront sur
l'ensemble des thématiques liées aux ressources linguistiques, et
notamment:
- la modélisation des données linguistiques constituant les ressources
: (cadres formels linguistiquement motivés, représentations
d'informations linguistiques sous forme de données structurées et/ou
quantitatives, normes pour les ressources linguistiques…).
- les méthodologies de développement de ressources linguistiques,
qu'elles soient purement manuelles, purement automatiques ou
hybrides (techniques semi-supervisées, méthodes par transfert
interlingue, utilisation d'outils de pré-annotation, interfaces de
validation/correction, etc.) ; les approches favorisant à la fois la
pertinence linguistique et la minimisation du "coût humain" seront
particulièrement appréciées.
- la validation et l'évaluation des ressources linguistiques, y
compris au sein de systèmes de TAL mais également de linguistique
expérimentale ; les contributions devront montrer en quoi
l'utilisation de ressources linguistiques a permis d'améliorer les
performances d'un système ou la compréhension d'un phénomène et/ou
constituer un moyen pertinent d'évaluer voire d'améliorer ces
ressources linguistiques.
Sont attendues en priorité des contributions en lien avec des
ressources linguistiques pour le français, ou, mieux encore, des
ressources multilingues dont l'une des langues est le français. Les
travaux concernant des ressources pour d'autres langues romanes sont
également pertinentes. Parallèlement, les contributions en lien avec
des ressources libres seront particulièrement appréciées.
Comité scientifique:
Nicolas Asher
Delphine Bernhard
Paul Buitelaar
Maria Teresa Cabré
Emmanuel Cartier
Anne Condamines
Benoît Crabbé
Cecile Fabre
Mikel Forcada
Gregory Grefenstette
Eva Hajicová
Nancy Ide
Christine Jacquin
Anne Lacheret
Marie-Claude L'Homme
Joseph Mariani
Piet Mertens
Asunción Moreno
Sophie Rosset
Agata Savary
Jesse Tseng
Agnès Tutin
Gertjan van Noord
Piek Vossen
Geoffrey Williams
Dates importantes
- Date limite de soumission: 30 September 2011
- Notification aux auteurs: 15 January 2012
- Date limite pour la version finale: 3 March 2012
- Publication en ligne: mid 2012
THE JOURNAL
Depuis 40 ans, TAL (Traitement Automatique des Langues) est un journal
international publié par l'ATALA (Association pour le Traitement
Automatique des Langues) avec le soutien du CNRS. Depuis quelques
années il s'agit d'un journal en ligne, des versions papier pouvant
être obtenues sur commande. Ceci n'affecte en rien le processus de
relecture et de sélection.
INFORMATIONS PRATIQUES
Les auteurs ayant l'intention de soumettre un article sont invités à
contacter les rédacteurs en chef invités de ce numéro: Benoît Sagot
(INRIA Paris Rocquencourt), benoit.sagot at inria.fr, et Núria Bel
(IULA, Universitat Pompeu Fabra, Barcelona), nuria.bel at upf.edu.
Les contributions (25 pages maximum, format PDF) devront être envoyées
par e-mail aux adresse suivantes : benoit.sagot at inria.fr et
nuria.bel at upf.edu.
Les feuilles de style sont disponibles sur le site web du journal:
http://www.atala.org/Instructions-aux-auteurs-feuilles
Le journal ne publie que des contributions originales, en français ou
en anglais.
Instructions aux auteurs:
http://www.atala.org/Instructions-aux-auteurs-feuilles
============================================
CALL FOR PAPERS
Special Issue of the TAL (Traitement Automatique des Langues / Natural
Language Processing) Journal on "Free Language Resources"
ATALA (French Association for Natural Language Processing) invites
authors to submit papers for the Special Issue on "Free Language
Resources".
Latest developments and applications in the field of Natural Language
Processing have significantly changed the paradigms for the design,
construction, operation and evaluation of, the so called, Language
Resources. In particular, the growing importance of empirical
approaches has raised the demand of corpora and lexica as major
sources of data on languages. An increasingly important number of
languages, including French and other Romance languages, are gradually
becoming equipped with new and richer resources.
Language Resources can be textual, oral or multimodal. They include:
- written or oral corpora, raw or, more interestingly, enriched with
annotations of several kinds, which can range from morphosyntactic
labels to prosodic information, from dependence graphs to discourse
structure markup.
- lexical resources with information about one or more levels of
linguistic analysis, and also grammars or other forms of modeling
different types of language structures — the boundary between
lexicon and grammar depends often on the approach (cf. TAG,
lexicon-grammar, etc.).
- complex resources, combining an annotated corpus and an associated
lexical database or combining information from different levels of
linguistic analysis.
A language resource may involve one or more variants of the language
or languages covered: standard language, the language of journalism,
specialized language (often with great importance given to issues of
terminology), oral language (if transcribed), blogs and forums, SMS,
etc..
However, the development of language resources is a long, expensive
and highly error prone task regardless of the approaches used. This is
one of the reasons for the increasing importance of resources which
are freely available, so that authors and owners, while keeping the
authorship, allow for their exploitation, transformation and
redistribution.
The goal of this special issue is to focus on the full range of
scientific issues related to language resources that go beyond the
description of the resources by themselves. Thus, expected
contributions can cover all topics related to language resources,
including:
- Modeling of the language data that constitute the resource (both
linguistically motivated formal frameworks, representation of
linguistic information in the form of structured and/or quantitative
data, standards for Language Resources ...)
- Methodologies for the development of Language Resources, either by
hand, completely automatic or hybrid (semi-supervised techniques,
interlingual transfer methods, use of pre-annotation tools,
validation / correction interfaces, etc.), approaches promoting
linguistic relevance while minimizing the "human cost" are most
welcome.
- Methods for validation and evaluation of language resources
including extrinsic evaluation within NLP systems and for
experimental linguistic purposes. Contributions must show how the
use of language resources has caused system performance
improvements, better understanding of phenomenon and/or be a means
to assess or improve these language resources.
Language Resources for French, or better multilingual resources or
language independent methods where French is one of the addressed
languages, are the main objective of this call. Works on resources for
other Romance languages are also relevant. In addition, contributions
related to free resources will be particularly appreciated.
Scientific Committee
Nicolas Asher
Delphine Bernhard
Paul Buitelaar
Maria Teresa Cabré
Emmanuel Cartier
Anne Condamines
Benoît Crabbé
Cecile Fabre
Mikel Forcada
Gregory Grefenstette
Eva Hajicová
Nancy Ide
Christine Jacquin
Anne Lacheret
Marie-Claude L'Homme
Joseph Mariani
Piet Mertens
Asunción Moreno
Sophie Rosset
Agata Savary
Jesse Tseng
Agnès Tutin
Gertjan van Noord
Piek Vossen
Geoffrey Williams
Important Dates
- Deadline for submission: 30 September 2011
- List of papers selected: 15 January 2012
- Deadline for camera ready papers: 3 March 2012
- Publication on line: mid 2012
THE JOURNAL
TAL (Traitement Automatique des Langues / Natural Language Processing)
is a forty year old international journal published by ATALA (French
Associationfor Natural Language Processing) with the support of CNRS
(National Centre for Scientific Research). It has moved to an
electronic mode of publication, with printing on demand. This affects
in no way its reviewing and selection process.
PRACTICAL ISSUES
Authors intending to submit a paper are encouraged to contact the
guest editors of the issue: Benoît Sagot (INRIA Paris Rocquencourt),
benoit.sagot at inria.fr, et Núria Bel(IULA, Universitat Pompeu Fabra,
Barcelona), nuria.bel at upf.edu.
Contributions (25 pages maximum, PDF format) must be sent by e-mail to
the addresses below : benoit.sagot at inria.fr and nuria.bel at
upf.edu.
Style sheets are available for download on the Web site of the
journal: http://www.atala.org/English-style-files.
The journal only publishes original contributions in French or in
English.
Check the instructions to authors:
http://www.atala.org/English-style-files.
-------------------------------------------------------------------------
Message diffuse par la liste Langage Naturel <LN at cines.fr>
Informations, abonnement : http://www.atala.org/article.php3?id_article=48
English version :
Archives : http://listserv.linguistlist.org/archives/ln.html
http://liste.cines.fr/info/ln
La liste LN est parrainee par l'ATALA (Association pour le Traitement
Automatique des Langues)
Information et adhesion : http://www.atala.org/
-------------------------------------------------------------------------
More information about the Ln
mailing list