15.3082, Calls: Text/Corpus Ling/France; Applied Ling/Spain

LINGUIST List linguist at linguistlist.org
Mon Nov 1 05:20:00 UTC 2004


LINGUIST List: Vol-15-3082. Mon Nov 01 2004. ISSN: 1068 - 4875.

Subject: 15.3082, Calls: Text/Corpus Ling/France; Applied Ling/Spain                                                                                                                                                             

Moderators: Anthony Aristar, Wayne State U <aristar at linguistlist.org>
            Helen Aristar-Dry, Eastern Michigan U <hdry at linguistlist.org>
 
Reviews (reviews at linguistlist.org) 
        Sheila Collberg, U of Arizona  
        Terry Langendoen, U of Arizona  

Homepage: http://linguistlist.org/

The LINGUIST List is funded by Eastern Michigan University, Wayne
State University, and donations from subscribers and publishers.

Editor for this issue: Amy Wronkowicz <amy at linguistlist.org>
================================================================  

As a matter of policy, LINGUIST discourages the use of abbreviations
or acronyms in conference announcements unless they are explained in
the text.

To post to LINGUIST, use our convenient web form at 
http://linguistlist.org/LL/posttolinguist.html. 



===========================Directory==============================  

1)
Date: 29-Oct-2004
From: Serge Heiden < slh at ens-lsh.fr >
Subject: Journée ATALA Articuler les traitements sur corpus 

2)
Date: 29-Oct-2004
From: Sandra Peña < spena at flog.uned.es >
Subject: XXIII Congreso de la Asociación Española de Lingüística Aplicada 
 

	
-------------------------Message 1 ---------------------------------- 
Date: Mon, 01 Nov 2004 00:02:48
From: Serge Heiden < slh at ens-lsh.fr >
Subject: Journée ATALA Articuler les traitements sur corpus 
 

Full Title: Journée ATALA Articuler les traitements sur corpus 

Date: 05-Feb-2005 - 05-Feb-2005
Location: Paris, France 
Contact Person: Serge Heiden
Meeting Email: slh at ens-lsh.fr
Web Site: http://www.atala.org

Linguistic Field(s): Text/Corpus Linguistics 

Call Deadline: 01-Dec-2004 

Meeting Description:

Journée d'étude de l'ATALA (Association pour le Traitement Automatique des
LAngues) 
http://www.atala.org
Articuler les traitements sur corpus
Samedi 5 février 2005 - ENST  46 r Barrault, 75634 Paris Cédex 13

Organisateurs : Benoît Habert (LIMSI et université Paris X -
habert at limsi.fr), Serge Heiden (ICAR - ENS LSH - slh at ens-lsh.fr), André
Salem (Syled - Paris III - salem at msh-paris.fr)

Le traitement des données textuelles articule, probablement pour encore
quelques années, des données non structurées (texte ''brut''), des données
semi-structurées (formats d'entrée/sortie plus ou moins contraignants des
logiciels utilisés) et données structurées (XML, graphes d'annotation...).
Les outils traitent/produisent des données selon des formats variables et
d'ailleurs évolutifs.

La plupart des logiciels utilisent en outre des représentations internes
des données textuelles, comme des index, qui permettent des réorganisations
et des traitements plus efficaces de la chaîne textuelle (concordances,
repérage des cooccurrences etc.) tout en constituant, du même coup,
empiriquement, des unités textuelles aux statuts très variables.

Enfin, ils offrent divers moyens de visualisation des données résultats ou
intermédiaires en sollicitant des interfaces aux ergonomies très variables.

Pour des projets d'envergure, des architectures ont été conçues pour
articuler modules et formats hétérogènes. C'est le cas de GATE [Gaizauskas
et al. 98] à l'université de Sheffield pour MUC. Ces architectures, trop
lourdes, n'offrent pas une solution satisfaisante pour le quotidien.
D'autres architectures font le choix de flux XML pour l'enchaînement des
traitements (LT-XML [http://www.ltg.ed.ac.uk/software/xml/]] et les flux
SAX de Cocoon [http://cocoon.apache.org/2.1/overview.html#Pipeline]).

La journée d'étude proposée abordera en particulier les points suivants :

- faut-il aller vers des architectures ''tout XML'' ou privilégier des
moyens d'associer modules etformats hétérogènes ?

- quels moyens utiliser pour avancer dans la standardisation des formats
d'annotation des données et la formalisation de la sémantique de ces
annotations, de sorte à faciliter et à expliciter l'enchaînement des divers
traitements (EAGLES, ISLE) ?

- quelles architectures utiliser pour articuler la gestion des entrepôts de
données et l'application des divers outils d'enrichissement et d'analyse
des données (client/serveur.) ?

- quels formats retenir pour faciliter l'annotation multiple et complexe de
corpus (graphes d'annotation, annotation 'déportée' ou « stand-off » ...) ?

- quelle utilisation effective des en-têtes à la TEI (Text Encoding
Initiative) ou XCES (XML Corpus Encoding Standard) ou d'aides au catalogage
(OLAC) pour mémoriser la signalétique accompagnant les corpus ? quelle
interaction avec les propositions du consortium W3C pour noter les
méta-données (RDF, par exemple) ?

- l'histoire des traitements d'un corpus (son cycle de vie), de ses
versions, de ses partitions est souvent impossible à reconstituer : on
dispose de résultats (texte étiqueté/lemmatisé, analyse syntaxique en
dépendances, couples d'information mutuelle, etc.) dont on ne sait plus
avec quoi ils ont été obtenus et selon quels paramétrages.

- est-il possible de normaliser la description des traitements effectués
afin de permettre la répétition des mêmes chaînes de traitement à des
données diverses ?

Comité de lecture

Michael Beddow  (Anglo-Norman On-Line Hub)
Lou Burnard (UOxford)
Jean Carletta (HCRC UEdinburgh)
François Daoust (UQAM)
Michel Jacobson (Lacito CNRS)
Sylvaine Nugier (EDF R&D)
Mark Olsen (UChicago)
Thierry Poibeau (LIPN)
Laurent Romary (LORIA)
Ludovic Tanguy (ERSS)
Jean Véronis (DELIC - Aix)
Matthew Zimmerman (NYU)
Pierre Zweigenbaum (DIAM-SIM AP-HP)

Les propositions de communication (de 1 à 5 pages) devront parvenir aux
organisateurs pour le 1er décembre 2004.

Dates limites importantes

Proposition de communication : 1er décembre 2004
Notification d'acceptation/rejet : 10 janvier 2005

Serge Heiden, slh at ens-lsh.fr, https://weblex.ens-lsh.fr
ENS-LSH/CNRS - ICAR UMR5191, Institut de Linguistique Française
15, parvis René Descartes 69342 Lyon BP7000 Cedex, tél. +33 4 37 37 63 12,
fax. +33 4 37 37 62 65



	
-------------------------Message 2 ---------------------------------- 
Date: Mon, 01 Nov 2004 00:02:57
From: Sandra Peña < spena at flog.uned.es >
Subject: XXIII Congreso de la Asociación Española de Lingüística Aplicada 

	

Full Title: XXIII Congreso de la Asociación Española de Lingüística Aplicada 
Short Title: XXIII CONGRESO AESLA 

Date: 10-Mar-2005 - 12-Mar-2005
Location: Palma de Mallorca, Islas Baleares, Spain 
Contact Person: Sandra Peña
Meeting Email: spena at flog.uned.es
Web Site: http://www.aesla.uji.es

Linguistic Field(s): Applied Linguistics 

Call Deadline: 30-Nov-2004 

Meeting Description:

XXIII Congreso de la Asociación Española de Lingüística Aplicada
(Palma de Mallorca, Spain, 10-12 March 2005)
Papers in all areas of lexis, especially within the framework of Cognitive
Linguistics, are welcome. 

Submission Guidelines
Proposals are solicited for oral presentations, posters, and round tables
related to any topic dealing with lexicology and lexicography.
All submissions should follow the specifications below:
All proposals should be maximum 2500 words, including references and
footnotes. Each proposal will be reviewed anonymously. They can be written
in English, Spanish, or Catalan.
In the case of round tables the authors should send a general abstract (of
no more than 500 words) and short summaries of each of the contributions
(no more than 250 words each).
The authors must send two anonymous copies and another copy in which the
following information is specified to the address below:
- author name(s)
- affiliation(s)
- full mailing address
- telephone number
- fax number
- email address
- title of presentation
- (three or four) keywords
- presenter(s) name (person/s who will be making the presentation)
- format:
a) oral presentation
b) poster
c) round table

Submit your proposal to the following address:

Sandra Peña
National University of Distance Education (UNED)
Facultad de Filología
Dpto. Filologías Extranjeras y sus Lingüísticas
Paseo Senda del Rey 7
28040 Madrid (Spain)
e-mail: spena at flog.uned.es

Submission deadline: November 30, 2004


 


-----------------------------------------------------------
LINGUIST List: Vol-15-3082	

	



More information about the LINGUIST mailing list