Appel: revue TAL: traitement automatique des corpus oraux

alexis.nasr at LINGUIST.JUSSIEU.FR alexis.nasr at LINGUIST.JUSSIEU.FR
Thu Oct 30 12:54:38 UTC 2003


[English below]


                              Appel à soumissions
                   Revue Traitement Automatique des Langues
                                   (T.A.L.)

                   "Traitement automatique des corpus oraux"


                                       *
                                      * *

            Numéro dirigé par Jean Véronis (Université de Provence)

                  Date limite de soumission : 15 mars 2004

              http://www.atala.org/tal/appel-corpus-oral.html





Contexte
--------

Alors qu'on dispose de plusieurs centaines de millions de mots de
textes écrits (et que le gigantesque réservoir qu'est le World Wide
Web repousse chaque jour cette limite), on dispose de très peu de
données sur l'oral.  Les corpus de langue orale spontanée sont
pourtant d'une importance fondamentale pour l'étude linguistique,
comme pour la mise au point de nouvelles technologies vocales.

Après l'anglais (British National Corpus, Santa Barbara Corpus of
American English, Corpus CANCODE, etc.), des corpus oraux importants
sont en cours de constitution pour diverses langues (Corpus Gesproken
Nederlands, Corpus of Spoken Israeli Hebrew, Corpus du Portugais
Parlé, etc.), mais le développement de corpus oraux transcrits et
annotés est extrêmement coûteux. Au cours de la dernière décennie, les
outils d'annotation et de traitement automatique des corpus écrits se
sont fortement développés, mais l'on est bien loin de disposer
d'outils équivalents pour l'oral. D'un autre côté, les phonéticiens
ont développé des outils pour l'analyse de la parole expérimentale (ou
parole "de laboratoire"), mais leur applicabilité à la parole
spontanée n'est pas nécessairement immédiate, étant donné les
différences de taille des corpus en jeu, le niveau de granularité
différent des analyses visées, et bien sûr les phénomènes spécifiques
à la parole spontanée (forte variabilité, dysfluences, syntaxe non
canonique, etc.).

Objectifs
---------

Le présent numéro de la revue Traitement Automatique des Langues
(T.A.L.)  vise à faire le point sur les technologies disponibles pour
le traitement des corpus oraux et à répondre à des questions telles
que la possibilité d'adaptation des techniques développées pour
l'écrit ou la réutilisabilité plus ou moins grande des techniques
développées pour la parole de laboratoire.

La liste suivante énumère, de façon non exhaustive, divers sujets
pertinents pour cet appel :

    - outils d'aide à la transcription
    - phonétisation
    - segmentation (pauses, tours de parole) et alignement texte-son
    - repérage des hésitations, répétitions, dysfluences et autres
phénomènes
      de l'oral spontané
    - étiquetage prosodique
    - étiquetage morpho-syntaxique ("tagging")
    - analyse syntaxique ("chunking", "shallow parsing")
    - autres niveaux d'analyse (anaphores, etc.)
    - outils de recherche et d'exploitation


Comité de lecture spécifique
----------------------------

      Jean-Yves Antoine (Université de Bretagne Sud)
      Claude Barras (LIMSI-CNRS)
      Frédéric Béchet (Université d'Avignon)
      Edouard Geoffrois (DGA)
      Dafydd Gibbon (Universität Bielefeld)
      Daniel Hirst (LPL-CNRS)
      Amy Isard (University of Edinburgh)
      Joaquim Llisterri (Universitat Autònoma de Barcelona)
      Philippe Martin (Université Paris VII)
      Joakim Nivre (Växjö Universitet)
      Nelleke Oostdijk (Katholieke Universiteit Nijmegen)
      Geoffrey Sampson (University of Sussex)
      Antonio Moreno Sandoval (Universidad Autónoma de Madrid)
      François Yvon (ENST)

Format
------

Les articles (25 pages maximum) seront soumis au format Word ou LaTeX
(dans ce dernier cas joindre un fichier PDF). Les feuilles de style
sont disponibles chez HERMES:

http://tal.e-revues.com/appel.jsp

Langue
------

Les articles peuvent être écrits en français ou en anglais.
Cependant, les soumissions en anglais ne sont acceptées que pour les
auteurs non francophones.

Calendrier
----------

La date limite de soumission est fixée au 15 mars 2004. Les personnes
qui ont l'intention de soumettre un article sont invitées à prendre
contact avec Jean Véronis <Jean.Veronis at up.univ-mrs.fr>.

Les articles seront relus par un membre du comité de rédaction de la
revue TAL et par deux relecteurs du comité de lecture constitué
spécifiquement par les coordinateurs pour ce numéro. La décision du
comité de rédaction sera transmise aux auteurs avant le 31 mai 2004.

La version définitive des articles acceptés sera à remettre pour le
1er juillet 2004 pour une publication prévue fin 2004.

Envoi des articles
------------------

Les articles (25 pages maximum, au format Hermès)
doivent être envoyés par voie électronique à

    Jean Véronis <Jean.Veronis at up.univ-mrs.fr>

=======================================================================


                              Call for papers
                  Journal "Traitement Automatique des Langues"
                                   (T.A.L.)

                          "Spoken corpus processing"


                                       *
                                      * *

           Special issue edited by Jean Véronis (Université de Provence)

                     Submission deadline : 15 March 2004

              http://www.atala.org/tal/appel-corpus-oral.html





Context
-------

Several hundred million words of written texts are available for
research and the World Wide Web pushes this limit further everyday. At
the same time, very few spontaneous spoken language corpora are
available, although they are of prime importance for linguistic
studies and the development of spoken language technologies.

A number of spoken corpora have been completed for English (British
National Corpus, Santa Barbara Corpus of American English, Corpus
CANCODE, etc.) and some are being developed for other languages
(Corpus Gesproken Nederlands, Corpus of Spoken Israeli Hebrew, Corpus
of Spoken Portuguese, etc.), but the transcription and annotation of
spoken corpora is a very expensive process.  In the last decade, many
annotation and processing tools have been developed for written
corpora, but equivalent tools for spoken data are very far from being
available. Of course, phonetic institutes have developed sophisticated
tools for the analysis of laboratory speech, but their applicability
to spontaneous data is not immediate, given the different corpus
sizes, the different types of analyses, and the phenomena that are
specific to spontaneous speech (high variability, disfluencies, non
canonical syntax, etc.).


Objectives
----------

The present issue of "Traitement Automatique des Langues" (T.A.L.)
aims at assessing the state of the art on the technologies available
for processing spoken corpora, and at answering questions such as the
adaptability of the techniques developed for written corpora, or the
degree of reusability of the techniques developed for laboratory
speech.

Topics of interest (non-exhaustive list):

    - tools for transcription
    - phonetisation
    - segmentation (pauses, speaker turns) and text-to-sound alignment
    - identification of hesitations, repeats, disfluencies and other
phenomena
      specific to spontaneous speech
    - prosodic tagging
    - morpho-syntactic tagging
    - chunking and shallow parsing
    - other analysis levels (anaphoras, etc.)
    - search and exploitation tools


External Reviewers
------------------

      Jean-Yves Antoine (Université de Bretagne Sud)
      Claude Barras (LIMSI-CNRS)
      Frédéric Béchet (Université d'Avignon)
      Edouard Geoffrois (DGA)
      Dafydd Gibbon (Universität Bielefeld)
      Daniel Hirst (LPL-CNRS)
      Amy Isard (University of Edinburgh)
      Joaquim Llisterri (Universitat Autònoma de Barcelona)
      Philippe Martin (Université Paris VII)
      Joakim Nivre (Växjö Universitet)
      Nelleke Oostdijk (Katholieke Universiteit Nijmegen)
      Geoffrey Sampson (University of Sussex)
      Antonio Moreno Sandoval (Universidad Autónoma de Madrid)
      François Yvon (ENST)

Format
------

Papers (25 pages maximum) may be submitted in Word or LaTeX (in the
latter case, please provide a PDF file). The publisher's style sheets
are available at:

http://tal.e-revues.com/appel.jsp

Language
--------

Papers may be written either in French or in English (non-French
speaking authors only).

Schedule
--------

The submission deadline is March 15th, 2004. Authors intending to
submit a paper should contact Jean Véronis
<Jean.Veronis at up.univ-mrs.fr>.

Articles will be reviewed by a member of the editorial board of the
journal and by two external reviewers chosen by the editors of the
special issue.  Editorial board decisions and referees' reports will
be transmitted to the authors by May 31st, 2004.

Final versions of accepted papers will be required by July 1st, 2004.
Publication is planned for the end of 2004.

Submission
----------

Submissions (25 pages maximum, following the publisher's style sheet)
should be sent electronically to:

    Jean Véronis <Jean.Veronis at up.univ-mrs.fr>







-------------------------------------------------------------------------
Message diffusé par la liste Langage Naturel <LN at cines.fr>
Informations, abonnement : http://www.biomath.jussieu.fr/LN/LN-F/
English version          : http://www.biomath.jussieu.fr/LN/LN/
Archives                 : http://listserv.linguistlist.org/archives/ln.html

La liste LN est parrainée par l'ATALA (Association pour le Traitement
Automatique des Langues)
Information et adhésion  : http://www.atala.org/
-------------------------------------------------------------------------



More information about the Ln mailing list