Appel: Revue TAL, Numero special "Plateformes pour le TAL"

Mon Nov 5 16:43:50 UTC 2007

Date: Thu, 1 Nov 2007 09:19:08 +0100
From: Patrice Enjalbert <Patrice.Enjalbert at info.unicaen.fr>
Message-Id: <2898D80D-4948-4251-940B-A50328788889 at info.unicaen.fr>
X-url: http://www.atala.org/
X-url: http://tal.e-revues.com/appel.jsp

[English version below]

APPEL À CONTRIBUTIONS

PLATEFORMES POUR LE TAL

NUMERO SPECIAL DE LA REVUE

« TRAITEMENT AUTOMATIQUE DES LANGUES (TAL) »

2008 Volume 49 Numéro 2

Date limite de soumission : 28 Janvier 2008

http://www.atala.org/

La recherche en Traitement Automatique des Langues fait de plus en
plus souvent appel à des infrastructures logicielles complexes. Faute
de modélisation "intégrative" du langage, on en produit des
modélisations régionales, partielles, et une plateforme est le moyen
de les articuler entre elles, de les faire coopérer ; de ce fait, il
est souvent nécessaire d'assembler au sein d'un même processus des
traitements et des ressources de natures et de provenances diverses,
ce qui pose d'importants problèmes d'interopérabilité. D'un autre
côté, la complexité croissante des modèles linguistiques demande des
moyens de formalisation sophistiqués tandis que la généralisation
d'une approche expérimentale sur des corpus larges et de formats
variés impose également des contraintes fortes sur les outils mis en
oeuvre.

Ces caractéristiques et exigences soulèvent de nombreuses questions
(dernièrement discutées à l'occasion de la journée ATALA
"Architectures logicielles pour articuler les traitements sur corpus"
en février 2005) qui seront au centre de ce numéro thématique, autour
de deux problématiques, interdépendantes et complémentaires, d'ordre
architectural d'une part, et méthodologique de l'autre.

1) Questions architecturales

L'articulation de différents modules de traitement pose de nombreux
problèmes d'interopérabilité et de coopération :

- interopérabilité entre les formats de représentation des corpus, des
  ressources linguistiques, des documents et de leurs annotations,
  ainsi que leur standardisation éventuelle ;

- compatibilité technique entre des traitements et des données
  hétérogènes : portabilité, disponibilité, maintenabilité, etc.

- interfaces permettant aux utilisateurs informaticiens et/ou
  linguistes d'assembler des "briques" de traitement et de visualiser
  leur projection en corpus ;

- traitement de la multimodalité et du multilinguisme ;

- modèles d'architecture: pipeline, orientés agents, services WEB
  distribués... ; techniques permettant de réduire la propagation des
  erreurs dans les traitements en cascade ; performances comparées des
  différents types d'architectures ; résistance à la montée en charge
  (données massives, exploitations simultanées en ligne..) ;

2) Question méthodologiques 

La démarche scientifique qui consiste à projeter un certain modèle
linguistique - ou un ensemble de modèles - sur un certain corpus,
soulève en tant que telle différentes questions :

- formalisation : quels formalismes employer pour les différents
  niveaux d'analyse linguistique ? Comment assurer leur
  interopérabilité? Faut-il privilégier l'expressivité ou la
  complexité des algorithmes associés ?

- capacités descriptives: comment assurer le caractère déclaratif d'un
  procédé de TAL complexe, depuis l'écriture des règles jusqu'à la
  spécification de l'enchaînement des traitements ? Peut-on envisager
  une convergence entre formalisations prescriptive (« opératoire »)
  et descriptive ?

- reproductibilité : comment assurer la reproductibilité d'une
  expérience basée sur un procédé complexe ? Comment assurer le
  partage et la capitalisation des modèles opérationnels et des
  ressources ?

- modularité des procédés : comment limiter les inter-dépendances
  entre les choix des différents composants d'un procédé complexe ?
  réutilisation/adaptation de ressources et de composants de
  traitement ; gestion des annotations multiples ;

- évaluation : comment évaluer les performances d'un procédé
  composite?

- productivité théorique : l'articulation de différents modèles
  "régionaux" de la langue permet-elle de mettre en évidence et
  d'étudier de nouveaux phénomènes, à une échelle de complexité
  supérieure ?

La présentation d'expériences d'intégration de plateformes de TAL au
sein d'architectures complexes à visée applicative (interfaces homme-
machine, recherche et extraction d'information, constitution de
termino/ontologies, traduction automatique, etc.) sera appréciée. La
description de plateformes spécifiques sera également intéressante
dans la mesure où elle fera apparaître clairement les principes et
hypothèses sous-jacentes de manière à contribuer à la réflexion
générale.

LA REVUE

La revue TAL (Traitement Automatique des Langues) est une revue
internationale éditée depuis 1960 par l'ATALA (Association pour le
Traitement Automatique des Langues) avec le concours du CNRS. Elle est
aujourd'hui publiée sous format électronique. Cela ne change
aucunement son processus de relecture et de sélection.

LANGUE

Les articles sont écrits en français ou en anglais.
Les auteurs francophones doivent soumettre leur article en français.
Les autres auteurs peuvent soumettre leur article en anglais.

DATES IMPORTANTES

- Tout de suite : Déclaration d'intention (facultative). Envoyez un
   mèl avec titre, auteurs, et résumé de 10 lignes à:
   tal-plateformes at info.unicaen.fr
-  28/01/2008 Date limite de soumission.
-  11/04/2008 Première décision du comite de rédaction.
-  18/05/2008 Version révisée.
-  09/06/2008 Décision finale du comité de rédaction.
-  Septembre 2008 Parution

SOUMISSION

Les articles (maximum 25 pages, format PDF) seront envoyés à  
l'adresse suivante:
tal-plateformes at info.unicaen.fr
Les feuilles de style sont disponibles en ligne sur le site http:// 
tal.e-revues.com/appel.jsp.

COORDINATEURS
Kalina BONTCHEVA (Université de Sheffield, Royaume Uni)
Patrice ENJALBERT (Université de Caen, France)
Benoît  HABERT (ENS LSH et ICAR, France)

COMITE DE LECTURE SPECIFIQUE
Jason BALDRIDGE (Université du Texas, Austin, USA)
Frédérik BILHAUT (Université de Caen, France)
Jean CARLETTA (Université d'Edimbourg, Royaume Uni)
Farid CERBAH (Dassault Aviation, France)
Javier COUTO (INCO, Uruguay)
Robert DALE (Macquarie University, Australie)
François DAOUST (UQAM, Québec, Canada)
Thierry DECLERCK (DFKI, Allemagne)
Serge HEIDEN (ENS LSH et ICAR, France)
Nancy IDE (Vassar College, New-York, USA & LORIA/CNRS, France)
Michel JACOBSON (LACITO, France)
Diana MAYNARD (Université de Sheffield, Royaume Uni)
Jean-Luc MINEL (MoDyCo, CNRS, France)
Sylvaine NUGIER (EDF, France)
Sébastien PAUMIER (Université de Marne-la-Vallée, France)
Etienne PETITJEAN (ATILF, France)
Thierry POIBEAU (LIPN-CNRS, France)
Laurent ROMARY (INRIA, France & MPG, Allemagne)
Vera Lucia STRUBE de LIMA (Pontifícia Universidade Católica do Rio  
Grande do Sul, Brésil)
Valentin TABLAN (Université de Sheffield, Royaume Uni)

------------------------------------------------------------------------

CALL FOR PAPERS

              PLATFORMS FOR NATURAL LANGUAGE PROCESSING

SPECIAL ISSUE OF « TRAITEMENT AUTOMATIQUE DES LANGUES » (TAL) JOURNAL

2008 Volume 49 Number 2

Deadline for submission: 28th January 2007

http://www.atala.org/

Research in NLP increasingly requires sophisticated software
architectures. Because there is no agreed "integrated" model of
language processing, researchers often produce ad hoc and application-
specific solutions, while NLP platforms help by bringing components
together and making them interoperable. Due to the complex nature of
NLP applications - and language itself - one needs to mix in the same
process different models, resources and algorithms, leading to
important problems of interoperability and data exchange. Moreover,
the increasing complexity of linguistic models implies sophisticated
formalisation tools, and the development of experimental studies on
large corpora also brings strong constraints on the software
environments.

These various characteristics and requirements raise many questions
which will be the focus of the present special issue on platforms for
language processing. Two interrelated and complementary aspects are
relevant: an architectural and a methodological one.

1)   Architectural issues
Bringing together different modules raises many architectural and
technical questions, centered around interoperability and data
exchange, such as:

- interoperability between representation formats of corpora,
  linguistic resources, documents and annotations; possible
  standardisation;

- technical compatibility of heterogeneous algorithms and data:
  portability, availability, maintainability, etc;

- graphical user interfaces supporting computer scientists and/ or
  linguists to assemble sets of "components" and to visualise and
  debug the results of their application to corpora;

- multimodality and multilinguism;

- software execution models: pipeline, agent-based architectures,
  distributed web services, etc; techniques for limiting errors from
  propagating into subsequent modules; efficiency comparisons of the
  various kinds of architectures; scalability (massive data,
  simultaneous on-line users...);

2)   Methodological issues
The scientific approach which consists in projecting a certain
linguistic model - or a set of models - on the same data or corpora
also raises interesting questions:

-       formalisation: which formalisms are appropriate for the  
  various levels of linguistic analysis? How can they be made  
  interoperable? What should be considered first: the expressivity of a  
  formalism or the complexity of the associated algorithms?

- descriptive power: how can we ensure the declarative nature of NLP
  processes, from linguistic rules to the specification of process
  chaining? Is it possible to have a convergence of descriptive and
  prescriptive models?

- repeatability: how to ensure that an experiment, based on complex
  algorithms, can be reproduced? How to share and capitalize on
  operational models and resources?

- modularity: how to make a complex process independent of the choice
  of a particular component for a particular task? Reuse and
  adaptation of resources and components; support for multiple
  annotations;

- evaluation of composite processes;

- theoretical productivity: by bringing together different "local"
  models can we study new linguistic phenomena, at a higher complexity
  level?

Presentation of concrete experiments embedding NLP platforms into
application-oriented software systems (human-machine interfaces,
information retrieval and extraction, terminology/ontology
constitution, automated translation...) is warmly encouraged.
Description of specific NLP platforms is also welcome, and authors
should then clearly explain the underlying principles and hypotheses,
in order to contribute to the general discussion.

THE JOURNAL
(see http://www.atala.org/)
The journal TAL (Traitement Automatique des Langues) is an
international journal published since 1960 by ATALA (Association pour
le Traitement Automatique des Langues) with the support of the CNRS.
It is now becoming available in electronic form, with print on
demand. The reading and selection process remain unchanged.

LANGUAGE
Manuscripts may be submitted in English or French. French-speaking  
authors are requested to submit in French.

IMPORTANT DATES
- as soon as possible : send an email including the title, authors  
and a ten lines abstract, to tal-plateformes at info.unicaen.fr    
(preferred but optional)
- 28/01/2008 Deadline for submission
- 11/04/2008 Notification to authors
- 18/05/2008 Deadline for submission of revised version
- 09/06/2008 Final decision
- September 2008 Publication

PAPER SUBMISSION

Contributions (25 pages maximum, PDF format) will be sent by e-mail  
at the address below:
tal-plateformes at info.unicaen.fr
Style sheets are available for download at http://tal.e-revues.com/ 
appel.jsp

GUEST EDITORS
Kalina BONTCHEVA (University of Sheffield, United Kingdom)
Patrice ENJALBERT (University of Caen, France)
Benoît  HABERT (ENS LSH & ICAR, France)

SCIENTIFIC COMMITTEE

Jason BALDRIDGE (University of Texas Austin, USA)
Frédérik BILHAUT (University of Caen, France)
Jean CARLETTA (University of Edinburgh, United Kingdom)
Farid CERBAH (Dassault Aviation, France)
Javier COUTO (INCO, Uruguay)
Robert DALE (Macquarie University, Australia)
François DAOUST (UQAM, Quebec, Canada)
Thierry DECLERCK (DFKI, Germany)
Serge HEIDEN (ENS-LSH & ICAR, France)
Nancy IDE (Vassar College, New-York, USA & LORIA/CNRS, France)
Michel JACOBSON (LACITO, France)
Diana MAYNARD (University of Sheffield, United Kingdom)
Jean-Luc MINEL (MoDyCo, CNRS, France)
Sylvaine NUGIER (EDF, France)
Sébastien PAUMIER (University of Marne-la-Vallée, France)
Etienne PETITJEAN (ATILF, France)
Thierry POIBEAU (LIPN-CNRS , France)
Laurent ROMARY (INRIA, France & MPG, Germany)
Vera Lucia STRUBE de LIMA (Pontifícia Universidade Católica do Rio  
Grande do Sul, Brasil)
Valentin TABLAN (University of Sheffield, United Kingdom)

-------------------------------------------------------------------------
Message diffuse par la liste Langage Naturel <LN at cines.fr>
Informations, abonnement : http://www.atala.org/article.php3?id_article=48
English version       : 
Archives                 : http://listserv.linguistlist.org/archives/ln.html
                                http://liste.cines.fr/info/ln

La liste LN est parrainee par l'ATALA (Association pour le Traitement
Automatique des Langues)
Information et adhesion  : http://www.atala.org/
-------------------------------------------------------------------------