[parislinguists] Appel à com, ColDoc 05

Wed Mar 2 11:23:15 UTC 2005

NOUVELLE DATE LIMITE

2ème Colloque des Jeunes Chercheurs du Laboratoire MoDyCo

Recueil des données en Sciences du langage et constitution de corpus :

données, méthodologie, outillage.

Les 16 et 17 juin 2005 se tiendra à l’Université Paris X – Nanterre la seconde édition de Col’Doc,  colloque organisé par les jeunes chercheurs du laboratoire Modèles, Dynamiques, Corpus (UMR 7114). L’objectif est de rassembler des étudiants de DEA, des doctorants et postdoctorants en Sciences du Langage, tous domaines confondus, autour d’un thème fédérateur : recueil des données et constitution de corpus.

Il ne semble pas que la réflexion linguistique puisse faire l’économie d’énoncés sur lesquels s’appuyer ; désignés comme faits, données ou encore exemples, ces matériaux linguistiques peuvent constituer un corpus.

Parfois réservée aux seuls ensembles d’énoncés attestés (Arrivé et alii, 1986 : 198, Riegel et alii, 1994 : 18), la dénomination corpus recouvre une réalité changeante (Mellet, 2002 : 6), la pression des approches quantitatives ayant joué un grand rôle dans la complexification de la notion (Habert, 1995 : 4). 

Il s’agit donc de montrer à travers l’ensemble des communications que le recueil des données et la notion de corpus qui lui est associée, en apparence si simples à saisir et à décrire, sont problématiques. Selon les hypothèses de chaque chercheur, selon les savoirs, selon les disciplines (syntaxe, lexique, sémantique, analyse de discours…) le recueil des données ne sera ni de même envergure (Fillmore 1992), ni de même nature : on n’attribuera pas la même valeur à la notion de corpus.

Les communications pourront partir des interrogations suivantes :

-          Qu’entend-on par corpus ?

-          Pourquoi constituer un corpus ?

-          Sur quel type d’énoncés (attestés, forgés, oraux, écrits...) travailler ?

-          De quelles sources extraire les données ? Est-ce d’un certain type de source (la littérature, la presse…) ? Est-ce à partir de supports existants (base de données informatisées, thèses soutenues, corpus répertoriés dans des ouvrages divers…) ?

-          Comment et où collecter les données ? Est-ce par le biais d’enquêtes ? A l’aide de requêtes sur Internet ou de logiciels disponibles ? Lesquels ?

-          Quelle exploitation faire du corpus ? Approche quantitative, tris (sur quels critères ?) ? Quelle est la méthodologie adoptée ?

-     On pourra également réfléchir aux problèmes soulevés par les notions de représentativité, d’exhaustivité, de corpus clos, d’acceptabilité, de grammaticalité. Les problèmes terminologiques pourront également être discutés (« attesté » vs « forgé », « corpus » vs « base de données » par exemple).

Références citées

Arrive m., Gadet f., Galmiche m. (1986) La grammaire d’aujourd’hui. Paris, Flammarion.

Corbin, p. (1980) « De la production de données en linguistique introspective », in A.-M. Dessaux-Berthonneau (ed.) Théorie linguistiques et traditions grammaticales, Villeneuve-d’Asq, Presses Universitaires de Lille (pp. 121-179).

Fillmore, c. j. (1992) « “Corpus linguistics” or “Computer-aided armchair linguistics” », in J. Svartvik (ed.) Directions in Corpus Linguistics, Berlin/New York, Mouton de Gruyter (pp. 35-60).

Habert, b. (1995) « Introduction », in T.A.L., 36, ATALA CNRS (3-5).

Habert, b. (ed.) (2004) R.F.L.A. vol IX-1 : Linguistique et informatique : nouveaux défis, Amsterdam, Edition “de Werelt”.

Mellet, s. (2002) « Corpus et recherches linguistiques. Introduction », in S. Mellet (ed.) Corpus, 1, Nice, Publications de la Faculté des lettres, arts et sciences humaines de Nice (pp. 5-12).

Milner, j.-c. (1989) Introduction à une science du langage, Paris, Le Seuil.

Riegel m., Pellat j.-c., Rioul r. (1994) Grammaire méthodique du français, Paris, PUF.

Modalités de soumission

Les communications sont de 30 minutes. Les propositions de communication seront évaluées anonymement par le comité scientifique.

Les auteurs feront parvenir leur proposition pour le 10 mars 2005 au plus tard par courrier électronique à coldoc_paris10 at yahoo.fr, sous la forme suivante :

-          dans le corps du message : nom, prénom, affiliation, niveau de la recherche (DEA, Thèse 1, 2, 3, 4 ou plus), adresse de correspondance, titre de la communication ;

-          dans un fichier joint au format .doc et dont le nom répondra au schéma suivant <nomd’auteur.doc> : un résumé de 3 000 signes maximum reprenant le titre de l’exposé, une indication bibliographique (5 titres maximum) – mais en aucun cas le nom du/des auteurs, ni du laboratoire auquel il(s) est/sont rattaché(s).

Comité d’organisation

Anne Lablanche,  Valelia Muni Toke, Céline Vaguer.

Calendrier :

-          10 mars 2005 : Limite des soumissions.

-          1er avril 2005 : Notification aux auteurs.

-          6 juin 2005 : Envoi de la première version de l’article.

-          16-17 juin 2005 : Colloque.

-          06/06 au 01/07 : Relecture des articles par le comité scientifique.

-          01/07 : Retour des articles accompagnés des remarques des relecteurs.

-          31/07 : Version définitive de l’article.
-------------- next part --------------
An HTML attachment was scrubbed...
URL: <http://listserv.linguistlist.org/pipermail/parislinguists/attachments/20050302/5f46e47b/attachment.htm>