Corpora: cfpnew : AnglaisFrancais
Beatrice daille
Beatrice.Daille at
Fri Nov 3 09:21:28 UTC 2000
--- Please accept our apologies for multiple copies ---
New corpora, new practices and new concepts
Special issue of the french journal TAL edited by
Beatrice Daille (IRIN, Nantes) and Laurent Romary (LORIA, Nancy)
Because of its corpus based, empirical approach and of its post-hoc
formalisation, Corpus linguistics has often been viewed as the
antithesis to computational linguistics.
Over the years, corpus linguistics has developed its own tools and
methods for identifying these linguistic constructs which are primary
to many linguistic applications such as language learning and
Today the development of the Internet, the availability in electronic
format of many publications and documentations as well as the increased
of computational tools promotes a renewed use of corpora at all
levels of linguistics theorising.
In this context, and going beyond a simple listing of technical
results, it seems important to recap the methodological and conceptual
progresses made in the field of corpus linguistics and to precisely
identify the role NLP played in these progresses.
In this special issue, we wish to publish either innovative papers or
synthesis and prospective articles bearing on the following topics:
- Corpora and Linguistic Theorising: Which new theories arose or is
arising from corpus work? How do these formal linguistic theories
account for the linguistic constructs found in corpora e.g.,
collocations, idioms etc?
- Corpus building: criteria, selection constraints and organisation
for which linguistic study? How can we measure the representativity
of a corpus with respect to a given linguistic construct?
- Methods and techniques: Which methods and techniques can we use for
analysis (concordences, statistics, annotations)?
- Domains and applications of corpus linguistics: field linguistics,
teaching, learning of stochastical models, semantic information
retrieval, extraction of mono- or multi-lingual lexica, discourse
analysis, translation.
- Infrastructure, tools and availability: Which representation
standards? What for? Platforms providing the access to big
corpora. Analysis tools.
Authors are strongly encouraged to use LaTeX2e and the HERMES
style files < rubrique Auteurs
Articles can be written in French or in English. English written
articles are only accepted from non-french speaking authors.
The deadline for submission is 1 February 2001. A notification of
intention to submit should be sent to Beatrice Daille
(Beatrice.Daille at or Laurent Romary
(Laurent.Romary at before 1 December 2000.
The articles will be referreed by a member of the TAL editorial
board and two members of the editorial committee specifically created
by the editors for this special issue. The decision of the editorial
boards will be communicated to the authors before 1 April 2001.
The final version of the accepted papers is due on 1 May for a
publication scheduled for Autumn 2001.
The articles must be submitted either electronically to
Isabelle.Blanchard at or as hardcopy (three copies) to:
Isabelle Blanchard
B.P. 239
F-54506 Vandoeuvre Les Nancy Cedex
Claire-Blanche Benveniste, Didier Bourigault, Lynne Bowker,
Etienne Brunet, Lou Burnard, Jean Carletta, Dan Cristea,
Alexander Geyken, Gaston Gross, Benoit Habert, Nancy Ide,
Judith Klavans, Martine Mazaudon, Elena Paskaleva,
Jennifer Pearson, Marie-Paule Péry-Woodley, Jean-Marie Pierrel,
François Rastier, André Salem, Anatole Shaikevich, Gary Simons,
John Sinclair, Wolfgang Teubert, Jean Véronis, Dusko Vitas.
The international journal Traitement Automatique des Langues (TAL) has
been published since 1969 by the french Association pour le traitement
automatique des langues (ATALA) with the support of the Centre
National pour la recherche scientifique (CNRS). The journal TAL covers
all fields of computational linguistics and its aim is to provide mainly
(but not only) french speaking researchers and students with
publications in all domains of computational linguistics. It appears
three times a year and is distributed by HERMES.
Pierrette Bouillon (ISSCO, Genève)
Philippe Blache (CNRS, Aix-en-Provence) -- Chief Editor
Danièle Clément (Bergische Universität Wuppertal)
Christophe d'Alessandro (LIMSI-CNRS, Orsay) -- Chief Editor
Anne Condamines (CNRS, Toulouse le Mirail),
Claire Gardent (Universität des Saarlandes) -- Chief Editor
Marc El-Bèze (Université d'Avignon),
Jean-Louis Lebrave (CNRS, Paris),
Piet Mertens (Katholieke Universiteit Leuven)
Évelyne Tzoukermann (Bell Labs)
Bernard Victorri (ENS, Paris)
Pierre Zweigenbaum (AP-HP, Paris 6)
Nouveaux corpus, nouvelles pratiques, nouveaux concepts
Numéro spécial de la revue TAL dirigé par
Beatrice Daille (IRIN, Nantes) et Laurent Romary (LORIA, Nancy)
La linguistique de corpus est souvent opposée à la linguistique
informatique du fait de sa démarche empirique à partir de corpus et
d'une formalisation des phénomènes linguistiques à posteriori. Elle a
développé depuis plusieurs années ses propres méthodes et outils pour
identifier certains phénomènes linguistiques primordiaux dans de
nombreux domaines de linguistique appliquée tels que l'apprentissage des
langues ou la traduction.
Aujourd'hui, le déploiement de l'Internet, la disponibilité de
nombreuses publications et documentations sous format électronique et
l'accroissement en puissance des outils informatiques a favorisé un
renouveau de l'usage de collections textuelles à tous les niveaux de
l'analyse linguistique.
Dans ce contexte et au delà du recensement de simples progrès
techniques, il semble important de faire le point sur les nouvelles
avancées méthodologiques et conceptuelles de la linguistique de corpus,
ainsi que de préciser quel rôle le TAL a joué dans ces avancées.
Dans ce numéro spécial, nous souhaitons publier soit des papiers
innovants, soit des articles de synthèse et de prospective autour des
thématiques suivantes :
- Corpus et modèles linguistiques : Quelles théories nouvelles sont
issues ou émergent du travail spécifique sur corpus ? Comment les
théories de linguistique formelle rendent-elles compte des phénomènes
linguistiques observés en corpus, tels que les collocations, les
phraséologies, etc ?
- Constitution de corpus : critères, contraintes de sélection et
organisation pour quelle étude linguistique ? Comment mesurer la
représentativité d'un corpus par rapport au phénomène linguistique
étudié ?
- Méthodes et techniques : Quelles méthodes et techniques d'analyse
(concordances, statistiques, annotations) ?
- Domaines et applications de la linguistique de corpus : Linguistique
de terrain, enseignement, apprentissage de modèles stochastiques,
méthodes d'accès au contenu, extraction de lexiques mono ou
multilingues, analyse de discours, traduction.
- Infrastructures, outils et accessibilité : quels standards de
représentation? pour quoi faire ? plate-forme d'accès aux grands corpus.
Outils d'analyse.
Nous recommandons l'utilisation de LaTeX2e pour la soumission des
articles. Les feuilles de style sont disponibles chez HERMES
< rubrique Auteurs>
Les articles sont écrits en français ou en anglais. Les soumissions en
anglais ne sont acceptées que pour les auteurs non francophones.
La date limite de soumission est fixée au 1er février 2001. Les
personnes qui ont l'intention de soumettre un article sont invitées à
prendre contact avec Béatrice Daille
(Beatrice.Daille at
ou Laurent Romary (Laurent.Romary at avant le 1er décembre 2000.
Les articles seront relus par un membre du comité de rédaction de la
revue TAL et deux relecteurs du comité de lecture constitué
spécifiquement par les coordinateurs pour ce numéro. La décision du
comité de rédaction sera transmise aux auteurs avant le 1er avril.
La version définitive des articles acceptés sera à remettre pour le 1er
mai pour une publication prévue à l'automne 2001.
Les articles doivent être envoyés par voie électronique à l'adresse
suivante :
Isabelle.Blanchard at
ou en version papier (trois exemplaires) par voie postale à l'adresse
suivante :
Isabelle Blanchard
Bâtiment Loria-CNRS
B.P. 239
F-54506 Vandoeuvre Les Nancy cedex
Claire-Blanche Benveniste, Didier Bourigault, Lynne Bowker,
Etienne Brunet, Lou Burnard, Jean Carletta, Dan Cristea,
Alexander Geyken, Gaston Gross, Benoit Habert, Nancy Ide,
Judith Klavans, Martine Mazaudon, Elena Paskaleva,
Jennifer Pearson, Marie-Paule Péry-Woodley, Jean-Marie Pierrel,
François Rastier, André Salem, Anatole Shaikevich, Gary Simons,
John Sinclair, Wolfgang Teubert, Jean Véronis, Dusko Vitas.
L'ATALA publie depuis 1969 la revue internationale Traitement
Automatique des Langues avec le concours du CNRS. Trois numéros par an
sont consacrés aux différents aspects du traitement automatique du
langage naturel. La revue TAL s'adresse en priorité aux chercheurs et
aux étudiants de langue française. Elle est publiée par l'ATALA :
( et est diffusée par HERMES.
Pierrette Bouillon (ISSCO, Genève)
Philippe Blache (CNRS, Aix-en-Provence) -- Chief Editor
Danièle Clément (Bergische Universität Wuppertal)
Christophe d'Alessandro (LIMSI-CNRS, Orsay) -- Chief Editor
Anne Condamines (CNRS, Toulouse le Mirail),
Claire Gardent (Universität des Saarlandes) -- Chief Editor
Marc El-Bèze (Université d'Avignon),
Jean-Louis Lebrave (CNRS, Paris),
Piet Mertens (Katholieke Universiteit Leuven)
Évelyne Tzoukermann (Bell Labs)
Bernard Victorri (ENS, Paris)
Pierre Zweigenbaum (AP-HP, Paris 6)
More information about the Corpora
mailing list