Appel: Journee ATALA - Productivite morphologique

Fri Sep 14 15:43:02 UTC 2007

Date: Thu, 13 Sep 2007 09:46:52 +0200
From: "Natalia Grabar" <natalia.grabar at spim.jussieu.fr>
Message-ID: <0DF1EEF0076C2E4FA7BAC7631C25A320049B0D at monaco.spim.jussieu.fr>

(english version below)

LA PRODUCTIVITÉ MORPHOLOGIQUE

Date : 10 novembre 2007

Organisation : Georgette Dal (STL, CNRS & Université de Lille),
Bernard Fradin (LLF, CNRS & Université de Paris 7), Natalia Grabar
(Centre de recherche des Cordeliers, Université de Paris 6, INSERM,
Paris).

Lieu : Paris (endroit exact à préciser)

Conférencier invité : Harald Baayen, University of Alberta Edmonton, Canada.

La présente journée est consacrée à la question de la productivité
morphologique dans le domaine du lexique construit.  La productivité
des règles de construction de lexèmes peut être abordée sous deux
aspects complémentaires, l'un qualitatif, l'autre quantitatif.  D'un
point de vue qualitatif, une règle de construction de lexèmes, conçue
ici comme un patron exprimant la généralisation de données
observables, est dite productive quand de nouveaux lexèmes, jamais
produits auparavant ou inconnus du locuteur qui les a produit, peuvent
l'instancier. La difficulté, avec cette définition, est qu'elle
nécessite de mettre en place des outils pour estimer la productivité
d'une règle donnée, étant entendu que l'intuition du locuteur, fût-il
linguiste, n'est pas un guide fiable.  Ces dernières années, la
principale avancée sur cette question ne concerne pas tant la
définition de la notion elle-même que, précisément, la proposition de
mesures permettant de l'objectiver et de dépasser la simple
intuition. Or, ces mesures requièrent des compétences diverses et
complémentaires, pouvant impliquer des chercheurs en linguistique
théorique, en traitement automatique des langues, en statistiques et
en psycholinguistique.

L'apport du traitement automatique des langues consiste, à partir d'un
corpus donné, à opérer un premier tri et à préparer les données sur
lesquelles portera l'analyse. Souvent, on utilise pour ceci des
traitements classiques du TAL, comme la segmentation, l'étiquetage
morpho-syntaxique ou la lemmatisation. Mais, lorsque les outils qui
effectuent l'analyse morphologique des lexèmes sont disponibles, ils
peuvent également intervenir dans la tâche et aider l'étape ultérieure
de sélection humaine des lexèmes construits. Les outils de ce type,
par exemple Derif (Namer, 2003), sont rares mais leur apport est
indéniable.
L'apport du TAL est aussi de permettre, une fois qu'il a été statué
sur les données, d'automatiser les calculs de la productivité.
L'apport essentiel des spécialistes en morphologie, sémantique et
psycholinguistique consiste à statuer sur les lexèmes retenus à
l'issue de la phase précédente. Lors de la sélection, on peut
distinguer par exemple les lexèmes (i) qui instancient effectivement
le patron étudié, (ii) les emprunts, (iii) les lexèmes dans lesquels
le procédé étudié n'est pas la dernière opération morphologique, (iv)
ceux dans lesquels il joue un rôle purement formel, etc.

Soumissions : =============

Toute proposition en rapport avec la thématique de la journée sera
examinée.  Il pourra s'agir de recherches portant sur : l'étude de la
productivité d'une règle de construction de lexèmes donnée, une
comparaison entre la productivité de règles de constructions de
lexèmes différentes, la pertinence d'opposer règles de construction de
lexèmes et règles de réalisation de lexèmes quant à leur productivité,
une discussion des mesures existantes ou sur la proposition d'autres
façons de mesurer la productivité morphologique.  On pourra aussi se
demander :
si l'étude de la productivité en morphologie requiert des approches et
ressources qui lui sont propres, ou si l'on peut réutiliser
l'outillage méthodologique et logiciel développé pour d'autres besoins
du TAL (étiqueteurs, lemmatisateurs, etc.), dans quelle mesure les
outils qui ont développés pour l'analyse en morphologie (Dérif, Flemm,
Automorphology, etc.) sont utilisables pour l'étude de la question de
la productivité en morphologie, etc.

Les soumissions portant sur le point de vue psycholinguistique sur la
question seront également les bienvenues.
Les langues de communication seront le français et, au besoin,
l'anglais.

Format et envoi des soumissions : =================================

Modalités de soumission :
1) Un résumé anonyme (en français ou en anglais) ne dépassant pas 1500
mots, bibliographie non comprise, l'ensemble (résumé + bibliographie)
ne dépassant pas 5 pages format A4 corps Times 12. Le résumé devra
spécifier clairement le sujet traité et les conclusions principales
établies en faisant référence aux travaux antérieurs sur la
question. Les données les plus centrales, qui permettent d'étayer vos
conclusions, devront être citées.
2) Une page séparée mentionnant vos nom et prénom, votre appartenance
administrative, votre adresse postale, votre statut, votre courriel et
le titre de votre contribution.
Les soumissions seront envoyées par courrier électronique, de
préférence au format .pdf, à productivite at linguist.jussieu.fr. Veillez
à envoyer le résumé et la page où figurent les renseignements
personnels sous des fichiers attachés distincts, le premier étant
nommé nom.abstact.pdf et le second nom.perso.pdf, où "nom" est le nom
de l'auteur de la soumission ou de l'auteur qui sert de contact en cas
d'auteurs multiples). Délai de rigueur : 1er octobre 2007. (On
acceptera un seul résumé à titre d'auteur unique, et un en
collaboration.

Les soumissions seront expertisées par le comité de lecture en double
anonymat.

Dates importantes : ===================
01/10/2007 : date limite de réception des soumissions 
15/10/2007 : notification aux auteurs
10/11/2007 : journée

Comité d'organisation : =======================
  Georgette Dal (STL, CNRS & Université de Lille),
  Bernard Fradin (LLF, CNRS & Université de Paris 7)
  Natalia Grabar (Centre de recherche des Cordeliers, Université de
  Paris 6, INSERM, Paris)

Comité de lecture : =======================
  Nabil Hathout (CLLE-ERSS, CNRS & Université de Toulouse Le Mirail),
  Stéphanie Lignon (ATILF CNRS & Nancy Université),
  Fanny Meunier (UMR 5596, CNRS & Université de Lyon, Université de
  Constance),
  Fiammetta Namer (ATILF CNRS & Nancy Université),
  Clément Plancq (LLF, CNRS & Université Paris 7),
  François Yvon (GET/ENST),
  Pierre Zweigenbaum (LIMSI, CNRS).

=============================================
English version
=============================================

MORPHOLOGICAL PRODUCTIVITY

Date: November 10th 2007

Organization: Georgette Dal (STL, CNRS & Université de Lille), Bernard
Fradin (LLF, CNRS & Université de Paris 7), Natalia Grabar (Centre de
recherche des Cordeliers, Université de Paris 6, INSERM, Paris).

Place: Paris (to be specified)

Invited conference: Harald Baayen, University of Alberta Edmonton, Canada.

This workshop addresses the morphological productivity of the
constructed lexicon.
The productivity of lexeme construction rules can be treated from two
complementary points of view: qualitative and quantitative.
from a quantitative point of view, a lexeme construction rule,
conceived here as a pattern which generalizes observed data, is
productive when new lexemes, never constructed before or unknown to
the speaker they are produced by, can instanciate it. The difficult
point with this definition is that it requires the use of tools to
measure the productivity of a given rule, since the intuition of the
speaker, even a linguist, is not a reliable criterion.  These last
years, the main progress on this question involves not so much the
definition of the notion of productivity as, precisely, the
proposition of measures which help to objectivise and go beyond simple
intuition. As a matter of fact, these measures require various and
complementary competences and involve researchers from theoretical
linguistics, natural language processing, statistics and
psycholinguistics.

The contribution of natural language processing consists of processing
a corpus in order to perform a first selection and prepare data for
further analysis. Classical NLP tools are frequently used, for
instance in tokenisation, part-of-speech tagging or lemmatisation of
corpora.
Nevertheless, morphological analysis tools can be used as well, if
available, to facilitate the final selection of constructed lexemes by
human experts.  Such tools, e.g., Derif (Namer, 2003), are not common
even though their contribution to this task is undeniable.
NLP is also used to automate the computation of productivity values
once the morphological data have been validated.

The role of experts in morphology, semantics and psycholinguistics
consists of determining the status of lexemes selected during the NLP
phase. As a matter of fact, it is important to make a distinction
between types of lexemes such as (i) lexemes which instanciate the
studied morphological pattern, (ii) borrowed lexemes, (iii) lexemes
where the studied pattern does not represent the last morphological
operation, (iv) lexemes where the morphological operation has a
completely formal role, etc.

Submission process: =============

Any proposal related to the topics of the workshop will be considered,
and more particularly works which address the following points:
study of the productivity of a given lexeme construction rule
comparison between the productivities of various lexeme construction
rules relevance of constrasting productivity of lexeme construction
rules and productivity of lexeme realisation rules discussion of
existing measures, proposal of new approaches for computing
morphological productivity.
Moreover, the following questions can be discussed:
Does the study of morpholocal productivity require specific approaches
and resources, or it is possible to reuse methodologies and tools
developed for other needs in NLP (POS taggers, lemmatisers, etc.).
To which extent can tools developed for morphological analysis (Dérif,
Flemm, Automorphology, etc.) be used when studying morphological
productivity.  etc.
Submissions on these questions from the psycholinguistics point of
view are welcome as well. 
Workshop languages: French and English.

Modality of submission: =================================

Submissions must include:
1) An anonymous abstract, in French or in English, of at most 1500
words, excluding bibliography. The whole submission (abstract and
bibliography) should not exceed 5 pages in A4 format, Times 12 pt. The
abstract should clearly state the topic addressed and specify the main
conclusions of the study. References to previous works in this area
should be mentioned. The most important data which allow to support
the findings should be presented.
2) A separate page with the following information: first and last
names, administrative affiliation, mail address, status, email address
and the title of the submission.

Submissions should be sent by email (.pdf format) to
productivite at linguist.jussieu.fr. Please send the abstract and the
author page as two separate files, the first should be named
name.abstact.pdf and the second name.perso.pdf, where "name" will be
replaced by the name of the submitting or contact author. Deadline:
October 1st 2007. (Only one abstract per author will be accepted.)

Submissions will be double blind reviewed by the scientific committee.

Imporant dates: ===================
01/10/2007: deadline for submission 
15/10/2007: notification to authors
10/11/2007: workshop

Organisation committee: =======================
  Georgette Dal (STL, CNRS & Université de Lille),
  Bernard Fradin (LLF, CNRS & Université de Paris 7)
  Natalia Grabar (Centre de recherche des Cordeliers, Université de
  Paris 6, INSERM, Paris)

Scientific committee: =======================
  Nabil Hathout (CLLE-ERSS, CNRS & Université de Toulouse Le Mirail),
  Stéphanie Lignon (ATILF CNRS & Université de Nancy),
  Fanny Meunier (UMR 5596, CNRS & Université de Lyon, Université de
  Constance),
  Fiammetta Namer (ATILF CNRS & Université de Nancy),
  Clément Plancq (LLF, CNRS & Université Paris 7),
  François Yvon (GET/ENST),
  Pierre Zweigenbaum (LIMSI, CNRS).

-------------------------------------------------------------------------
Message diffuse par la liste Langage Naturel <LN at cines.fr>
Informations, abonnement : http://www.atala.org/article.php3?id_article=48
English version       : 
Archives                 : http://listserv.linguistlist.org/archives/ln.html
                                http://liste.cines.fr/info/ln

La liste LN est parrainee par l'ATALA (Association pour le Traitement
Automatique des Langues)
Information et adhesion  : http://www.atala.org/
-------------------------------------------------------------------------