Appel: Linguistique de corpus a l'heure de la confrontation entre concepts, techniques et applications
Thierry Hamon
thierry.hamon at UNIV-PARIS13.FR
Wed Jun 6 09:05:39 UTC 2012
Date: Wed, 6 Jun 2012 10:16:51 +0200 (CEST)
From: "sandra.augendre" <augendre.sandra at wanadoo.fr>
Message-ID: <50697309.10432.1338970611212.JavaMail.www at wwinf2210>
DEUXIÈME APPEL À COMMUNICATIONS
La linguistique de corpus à l’heure de la confrontation
entre concepts, techniques et applications
14-15 décembre 2012
Université Bordeaux 3 – EA 4195 TELEM – UMR 5263 CLLE-ERSSàB
https://sites.google.com/site/corpus2012bordeaux3/
Date limite de réception des propositions : 20 juin 2012
Langues de communication : français, anglais
Ce colloque sera centré autour de trois thèmes :
A. comment coder les éléments discursifs à l’écrit et à l’oral ? quelles
convergences, quelles divergences dans le codage de l’écrit et de l’oral ?
Les logiciels d’annotation des corpus écrits sont déjà anciens et ils ne
permettent pas toujours d’aboutir à un balisage robuste ; il reste donc
un certain nombre de problèmes que l’on ne sait pas résoudre, tout en
entrevoyant une solution (traitement du discours). L’annotation des
corpus oraux est plus récente et pose encore de très nombreux problèmes
: on peut parfois s’appuyer sur les solutions envisagées pour l’écrit
parce que l’oral partage certaines propriétés avec l’écrit. Mais les
dissemblances entre oral et écrit sont aussi très prégnantes :
corrélation syntaxe / prosodie pour l’oral, cinétique de l’oral (l’oral
se structure en se produisant), opposition oral monologal / oral
dialogal, etc. Cela entraîne de grandes différences avec l’annotation de
l’écrit. Nous nous confronterons à trois questions : comment traiter les
phénomènes discursifs ? comment caractériser les convergences entre
codage de l’écrit et codage de l’oral ? comment problématiser et
caractériser la spécificité du codage de l’oral ?
B. coder la multimodalité : enjeux et défis.
Le codage des fichiers images et celui des vidéos présentent de
nombreuses particularités. Si le son est a priori non parsable et donc
rétif à l’emploi de XML, il conserve toutefois des points communs
(chaîne linguistique, séquentialité, etc.). En revanche, l’image et
l’image animée constituent des documents qui appellent surtout des
métadonnées. Comment peut-on dès lors coder les vidéos ? Cette question
en entraîne deux autres : comment coder les aspects iconiques de l’oral
? comment lier les codages des différents composants d’une vidéo ?
C. de la linguistique de corpus aux digital humanities.
La linguistique de corpus est de plus en plus confrontée à des champs
connexes auxquels elle est de plus en plus appelée à participer. Le
traitement de métadonnées l’expose à un parallélisme avec les grands
projets portant sur les métadonnées (par exemple, le Dublin Core). Mais
elle entre aussi dans l’élaboration des digital humanities, dans le fait
que les Humanités ou SHS sont de plus en plus technologisées, ce qui
appelle au moins deux questions : ces technologies agissent-elles sur
les concepts des SHS ? comment ces technologies transforment-elles les
procédures de traitement en SHS ? Dans ce cadre, nous devrons nous
confronter aux questions suivantes. Comment la linguistique de corpus
peut-elle jouer un rôle à ce niveau ? quelle part des digital humanities
peut-elle assumer ? en quoi la TEI permet-elle d’articuler linguistique
de corpus et digital humanities ?
Frais d’inscription : universitaires extérieurs à l’université de
Bordeaux : 30 €
étudiants extérieurs à l’Université de Bordeaux : 20 €
étudiants et personnels de l’Université de Bordeaux : gratuité
A compter du 1/10/2012 : universitaires extérieurs à l’université de
Bordeaux : 50 €
étudiants extérieurs à l’Université de Bordeaux : 30 €
MODALITÉS DE SOUMISSION D’UNE COMMUNICATION.
Envoyer deux fichiers au format pdf à l’adresse suivante :
colloque.corpus.bx3 at gmail.com
Le premier fichier comportera le nom du ou des auteurs de la
communication, le titre de la communication et le thème concerné (A, B
ou C) du colloque.
Le second fichier comportera le titre de la communication, le thème du
colloque concerné et un résumé de deux pages maximum comportant une
bibliographie. Le(s) nom(s) du/des auteur(s) ne pourra/pourront
apparaître dans ce fichier que dans la bibliographie.
COMITÉ SCIENTIFIQUE
Guy ACHARD-BAYLE (Univ. de Lorraine & CREM EA 3476), Philippe BLACHE
(Aix-Marseille & LPL UMR 7309), Lou BURNARD (Oxford & TGE Adonis), Paul
CAPPEAU (Poitiers & FoReLL EA 3816), Thierry CHANIER (Clermont 2 & LRL
EA 999), Ray COOKE (Bordeaux – Victor Segalen), Cécile FABRE (Toulouse
2, CLLE-ERSS UMR 5263), Evelyne JACQUEY (Univ. de Lorraine & ATILF UMR
7118), Marie-Noëlle LAMY (Open University & CREET), Benoît LE BLANC
(ENSC-IPB & UMR 5218), Damon MAYAFFRE (Nice-Sophia Antipolis & BCL UMR
7320), Sylvie MELLET (Nice-Sophia Antipolis & BCL UMR 7320), Lorenza
MONDADA (Bâle & ICAR UMR 5191), Sophie ROSSET (LIMSI UPR 3251),
Véronique TRAVERSO (ICAR UMR 5191), Agnès TUTIN (Grenoble 3 & LIDILEM EA
609), Jean-Marie VIPREY (Univ. de Franche-Comté & ELLIADD EA 4661)
COMITÉ D’ORGANISATION
Sandrine AGUERRE, Sandra AUGENDRE, Jean-Luc BERGEY, Gilles BOYÉ,
Jean-Sébastien BRILLEAUD, Marie-Odile HIDDEN, Anna KUPŚĆ, Catherine
MATHON, NGUYEN Van Toan, Christelle ROUET-DELARUE, Henri PORTINE
CALENDRIER
Mi-juin : ouverture des inscriptions au colloque
20 juin : date limite de réception des propositions de communication
15 septembre : envoi des réponses aux auteurs des propositions
14 & 15 décembre : colloque
Contact pour information : Henri.Portine at u-bordeaux3.fr
------------------------------------------------------------------------
CALL FOR PAPERS
Corpus Linguistics: How to bind concepts, technique and application?
14th – 15th December 2012
Université Bordeaux3 – EA TELEM – UMR 5263 CLLE-ERSSàB
https://sites.google.com/site/corpus2012bordeaux3/
Proposal submission deadline: 20th June 2012
Languages: French, English
This conference will focus on three topics:
A. how to encode discursive features in written and oral corpora? what
are the convergences and divergences between encoding written and oral
corpora?
Software for encoding written corpora have existed for quite a long time
and do not always produce a robust tagging. There are still a number of
problems that cannot be solved, even though we can foresee solutions
(discursive features). Oral corpora tagging is more recent and still
presents numerous problems. It is sometimes possible to fall back on
solutions worked out for written corpora, because oral language shares
some characteristics with written language. But differences between oral
and written communication are also significant: correlation between
syntax and prosody for oral language, kinetics of the oral language (it
is structured as it is being produced), opposition between monologal and
dialogical oral language, etc. This means that there are important
differences between oral and written tagging. Three questions arise: how
to process discursive features? how to characterize the convergences
between oral corpus tagging and written corpus tagging? how to
characterize and address oral tagging specificities?
B. tagging multimodality: issues and challenges
Image and video tagging is quite particular. Even though sound a priori
cannot be parsed, and therefore resists the use of XML, it still
presents similarities with written language? (linguistic chain,
sequentiality, etc.). However, images and videos are documents that
imply metadata. Consequently, how to tag videos? This question leads to
two more questions: how to tag iconic aspects of oral language? and how
to match the different types of tagging of a video?
C. from Corpus Linguistics to Digital Humanities
Corpus Linguistics more and more faces connected fields that needs to be
involved in. Its processing of metadata means that it is compared to
other projects dealing with metadata (such as Dublin Core Metadata
Initiative). Corpus Linguistics also participates in the design of
Digital Humanities, since Humanities and Social Sciences become more and
more technical, which leads to two questions at least: does technology
influence concepts in this field. How does technology transform data
processing in this field? Within this framework, we must address the
following questions: how can Corpus Linguistics play a part at this
level? what part of digital humanities can Corpus Linguistics take in
charge? how can TEI be used to connect Corpus Linguistics and digital
humanities?
Registration fee:
Academics: 30€
Students: 20 €From 01/10/2012:
Academics: 50€
Students: 30 €
SUBMISSION GUIDELINES
Send two files in PDF to the following address:
Colloque.Corpus.bx3 at gmail.com
First file’s content will be: author’s or authors’ name(s), title of
paper and relevant conference topic (A, B or C).
Second file’s content will be: title of paper, relevant conference
topic, and summary (two pages maximum, biography included). Authors’
names cannot appear on this file.
SCIENTIFIC COMMITTEE
Guy ACHARD-BAYLE (Univ. de Lorraine & CREM EA 3476), Philippe BLACHE
(Aix-Marseille & LPL UMR 7309), Lou BURNARD (Oxford & TGE Adonis), Paul
CAPPEAU (Poitiers & FoReLL EA 3816), Thierry CHANIER (Clermont 2 & LRL
EA 999), Ray COOKE (Bordeaux – Victor Segalen), Cécile FABRE (Toulouse
2, CLLE-ERSS UMR 5263), Evelyne JACQUEY (Univ. de Lorraine & ATILF UMR
7118), Marie-Noëlle LAMY (Open University & CREET), Benoît LE BLANC
(ENSC-IPB & UMR 5218), Damon MAYAFFRE (Nice-Sophia Antipolis & BCL UMR
7320), Sylvie MELLET (Nice-Sophia Antipolis & BCL UMR 7320), Lorenza
MONDADA (Bâle & ICAR UMR 5191), Sophie ROSSET (LIMSI UPR 3251),
Véronique TRAVERSO (ICAR UMR 5191), Agnès TUTIN (Grenoble 3 & LIDILEM EA
609), Jean-Marie VIPREY (Univ. de Franche-Comté & ELLIADD EA 4661)
ORGANISING COMMITTEE
Sandrine AGUERRE, Sandra AUGENDRE, Jean-Luc BERGEY, Gilles BOYÉ,
Jean-Sébastien BRILLEAUD, Marie-Odile HIDDEN, Anna KUPŚĆ, Catherine
MATHON, NGUYEN Van Toan, Christelle ROUET-DELARUE, Henri PORTINE
KEY DATES
Mid-June: registration opens
20th June: deadline for submissions
15th September: notification
14th – 15th December: Conference.
Contact for information: Henri.Portine at u-bordeaux3.fr
-------------------------------------------------------------------------
Message diffuse par la liste Langage Naturel <LN at cines.fr>
Informations, abonnement : http://www.atala.org/article.php3?id_article=48
English version :
Archives : http://listserv.linguistlist.org/archives/ln.html
http://liste.cines.fr/info/ln
La liste LN est parrainee par l'ATALA (Association pour le Traitement
Automatique des Langues)
Information et adhesion : http://www.atala.org/
-------------------------------------------------------------------------
More information about the Ln
mailing list