[Corpora-List] CFP: Morphological productivity DEADLINE EXTENSION: 15/10/2007

Natalia Grabar natalia.grabar at spim.jussieu.fr
Fri Sep 28 19:07:16 UTC 2007


ATALA workshop on 
MORPHOLOGICAL PRODUCTIVITY

Date: November 10th 2007

Organization: Georgette Dal (STL, CNRS & Université de Lille), Bernard Fradin
(LLF, CNRS & Université de Paris 7), Natalia Grabar (Centre de recherche des
Cordeliers, Université de Paris 6, INSERM, Paris).

Place: Paris (to be specified)

Invited conference: Harald Baayen, University of Alberta Edmonton, Canada.

This workshop addresses the morphological productivity of the constructed
lexicon.
The productivity of lexeme construction rules can be treated from two
complementary points of view: qualitative and quantitative.
>>From a quantitative point of view, a lexeme construction rule, conceived here
as a pattern which generalizes observed data, is productive when new lexemes,
never constructed before or unknown to the speaker they are produced by, can
instanciate it. The difficult point with this definition is that it requires
the use of tools to measure the productivity of a given rule, since the
intuition of the speaker, even a linguist, is not a reliable criterion. 
These last years, the main progress on this question involves not so much the
definition of the notion of productivity as, precisely, the proposition of
measures which help to objectivise and go beyond simple intuition. As a
matter of fact, these measures require various and complementary competences
and involve researchers from theoretical linguistics, natural language
processing, statistics and psycholinguistics. 

The contribution of natural language processing consists of processing a
corpus in order to perform a first selection and prepare data for further
analysis. Classical NLP tools are frequently used, for instance in
tokenisation, part-of-speech tagging or lemmatisation of corpora.
Nevertheless, morphological analysis tools can be used as well, if available,
to facilitate the final selection of constructed lexemes by human experts.
Such tools, e.g., Derif (Namer, 2003), are not common even though their
contribution to this task is undeniable.
NLP is also used to automate the computation of productivity values once the
morphological data have been validated.

The role of experts in morphology, semantics and psycholinguistics consists
of determining the status of lexemes selected during the NLP phase. As a
matter of fact, it is important to make a distinction between types of
lexemes such as (i) lexemes which instanciate the studied morphological
pattern, (ii) borrowed lexemes, (iii) lexemes where the studied pattern does
not represent the last morphological operation, (iv) lexemes where the
morphological operation has a completely formal role, etc.


Submission process: =============

Any proposal related to the topics of the workshop will be considered, and
more particularly works which address the following points:
study of the productivity of a given lexeme construction rule
comparison between the productivities of various lexeme construction rules
relevance of constrasting productivity of lexeme construction rules and
productivity of lexeme realisation rules
discussion of existing measures, proposal of new approaches for computing
morphological productivity.
Moreover, the following questions can be discussed:
Does the study of morpholocal productivity require specific approaches and
resources, or it is possible to reuse methodologies and tools developed for
other needs in NLP (POS taggers, lemmatisers, etc.).
To which extent can tools developed for morphological analysis (Dérif, Flemm,
Automorphology, etc.) be used when studying morphological productivity.
etc. 
Submissions on these questions from the psycholinguistics point of view are
welcome as well. 
Workshop languages: French and English.


Modality of submission: =================================

Submissions must include:
1) An anonymous abstract, in French or in English, of at most 1500 words,
excluding bibliography. The whole submission (abstract and bibliography)
should not exceed 5 pages in A4 format, Times 12 pt. The abstract should
clearly state the topic addressed and specify the main conclusions of the
study. References to previous works in this area should be mentioned. The
most important data which allow to support the findings should be presented. 
2) A separate page with the following information: first and last names,
administrative affiliation, mail address, status, email address and the title
of the submission.

Submissions should be sent by email (.pdf format) to
productivite at linguist.jussieu.fr. Please send the abstract and the author
page as two separate files, the first should be named name.abstact.pdf and
the second name.perso.pdf, where "name" will be replaced by the name of the
submitting or contact author. Deadline: October 15th 2007. (Only one abstract
per author will be accepted.)


Submissions will be double blind reviewed by the scientific committee.


Imporant dates: ===================
15/10/2007: deadline for submission 
25/10/2007: notification to authors
10/11/2007: workshop


Organisation committee: =======================
  Georgette Dal (STL, CNRS & Université de Lille),
  Bernard Fradin (LLF, CNRS & Université de Paris 7)
  Natalia Grabar (Centre de recherche des Cordeliers, Université de Paris 6,
INSERM, Paris)


Scientific committee: =======================
  Nabil Hathout (CLLE-ERSS, CNRS & Université de Toulouse Le Mirail),
  Stéphanie Lignon (ATILF CNRS & Université de Nancy),
  Fanny Meunier (UMR 5596, CNRS & Université de Lyon, Université de
Constance),
  Fiammetta Namer (ATILF CNRS & Université de Nancy),
  Clément Plancq (LLF, CNRS & Université Paris 7),
  François Yvon (GET/ENST),
  Pierre Zweigenbaum (LIMSI, CNRS).




Version française




La journée ATALA sur 
LA PRODUCTIVITÉ MORPHOLOGIQUE

Date : 10 novembre 2007

Organisation : Georgette Dal (STL, CNRS & Université de Lille), Bernard
Fradin (LLF, CNRS & Université de Paris 7), Natalia Grabar (Centre de
recherche des Cordeliers, Université de Paris 6, INSERM, Paris).

Lieu : Paris (endroit exact à préciser)

Conférencier invité : Harald Baayen, University of Alberta Edmonton, Canada.


La présente journée est consacrée à la question de la productivité
morphologique dans le domaine du lexique construit.
La productivité des règles de construction de lexèmes peut être abordée sous
deux aspects complémentaires, l'un qualitatif, l'autre quantitatif. 
D'un point de vue qualitatif, une règle de construction de lexèmes, conçue
ici comme un patron exprimant la généralisation de données observables, est
dite productive quand de nouveaux lexèmes, jamais produits auparavant ou
inconnus du locuteur qui les a produit, peuvent l'instancier. La difficulté,
avec cette définition, est qu'elle nécessite de mettre en place des outils
pour estimer la productivité d'une règle donnée, étant entendu que
l'intuition du locuteur, fût-il linguiste, n'est pas un guide fiable. 
Ces dernières années, la principale avancée sur cette question ne concerne
pas tant la définition de la notion elle-même que, précisément, la
proposition de mesures permettant de l'objectiver et de dépasser la simple
intuition. Or, ces mesures requièrent des compétences diverses et
complémentaires, pouvant impliquer des chercheurs en linguistique théorique,
en traitement automatique des langues, en statistiques et en
psycholinguistique. 

L'apport du traitement automatique des langues consiste, à partir d'un corpus
donné, à opérer un premier tri et à préparer les données sur lesquelles
portera l'analyse. Souvent, on utilise pour ceci des traitements classiques
du TAL, comme la segmentation, l'étiquetage morpho-syntaxique ou la
lemmatisation. Mais, lorsque les outils qui effectuent l'analyse
morphologique des lexèmes sont disponibles, ils peuvent également intervenir
dans la tâche et aider l'étape ultérieure de sélection humaine des lexèmes
construits. Les outils de ce type, par exemple Derif (Namer, 2003), sont
rares mais leur apport est indéniable.
L'apport du TAL est aussi de permettre, une fois qu'il a été statué sur les
données, d'automatiser les calculs de la productivité. 
L'apport essentiel des spécialistes en morphologie, sémantique et
psycholinguistique consiste à statuer sur les lexèmes retenus à l'issue de la
phase précédente. Lors de la sélection, on peut distinguer par exemple les
lexèmes (i) qui instancient effectivement le patron étudié, (ii) les
emprunts, (iii) les lexèmes dans lesquels le procédé étudié n'est pas la
dernière opération morphologique, (iv) ceux dans lesquels il joue un rôle
purement formel, etc.


Soumissions : =============

Toute proposition en rapport avec la thématique de la journée sera examinée.
Il pourra s'agir de recherches portant sur :
l'étude de la productivité d'une règle de construction de lexèmes donnée, 
une comparaison entre la productivité de règles de constructions de lexèmes
différentes, 
la pertinence d'opposer règles de construction de lexèmes et règles de
réalisation de lexèmes quant à leur productivité,
une discussion des mesures existantes ou sur la proposition d'autres façons
de mesurer la productivité morphologique.
On pourra aussi se demander :
si l'étude de la productivité en morphologie requiert des approches et
ressources qui lui sont propres, ou si l'on peut réutiliser l'outillage
méthodologique et logiciel développé pour d'autres besoins du TAL
(étiqueteurs, lemmatisateurs, etc.), 
dans quelle mesure les outils qui ont développés pour l'analyse en
morphologie (Dérif, Flemm, Automorphology, etc.) sont utilisables pour
l'étude de la question de la productivité en morphologie,
etc. 
Les soumissions portant sur le point de vue psycholinguistique sur la
question seront également les bienvenues. 
Les langues de communication seront le français et, au besoin, l'anglais.


Format et envoi des soumissions : =================================

Modalités de soumission :
1) Un résumé anonyme (en français ou en anglais) ne dépassant pas 1500 mots,
bibliographie non comprise, l'ensemble (résumé + bibliographie) ne dépassant
pas 5 pages format A4 corps Times 12. Le résumé devra spécifier clairement le
sujet traité et les conclusions principales établies en faisant référence aux
travaux antérieurs sur la question. Les données les plus centrales, qui
permettent d'étayer vos conclusions, devront être citées. 
2) Une page séparée mentionnant vos nom et prénom, votre appartenance
administrative, votre adresse postale, votre statut, votre courriel et le
titre de votre contribution.
Les soumissions seront envoyées par courrier électronique, de préférence au
format .pdf,  à productivite at linguist.jussieu.fr. Veillez à envoyer le résumé
et la page où figurent les renseignements personnels sous des fichiers
attachés distincts, le premier étant nommé nom.abstact.pdf et le second
nom.perso.pdf, où "nom" est le nom de l'auteur de la soumission ou de
l'auteur qui sert de contact en cas d'auteurs multiples). Délai de rigueur :
15 octobre 2007. (On acceptera un seul résumé à titre d'auteur unique, et un
en collaboration.

Les soumissions seront expertisées par le comité de lecture en double
anonymat.


Dates importantes : ===================
15/10/2007 : date limite de réception des soumissions 
25/10/2007 : notification aux auteurs
10/11/2007 : journée


Comité d'organisation : =======================
  Georgette Dal (STL, CNRS & Université de Lille),
  Bernard Fradin (LLF, CNRS & Université de Paris 7)
  Natalia Grabar (Centre de recherche des Cordeliers, Université de Paris 6,
INSERM, Paris)

Comité de lecture : =======================
  Nabil Hathout (CLLE-ERSS, CNRS & Université de Toulouse Le Mirail),
  Stéphanie Lignon (ATILF CNRS & Nancy Université),
  Fanny Meunier (UMR 5596, CNRS & Université de Lyon, Université de
Constance),
  Fiammetta Namer (ATILF CNRS & Nancy Université),
  Clément Plancq (LLF, CNRS & Université Paris 7),
  François Yvon (GET/ENST),
  Pierre Zweigenbaum (LIMSI, CNRS).
-------------- next part --------------
An HTML attachment was scrubbed...
URL: <http://listserv.linguistlist.org/pipermail/corpora/attachments/20070928/29410003/attachment.htm>
-------------- next part --------------
_______________________________________________
Corpora mailing list
Corpora at uib.no
http://mailman.uib.no/listinfo/corpora


More information about the Corpora mailing list