appel colloque SHESL-HTL 2015 CORPUS ET CONSTITUTION DES SAVOIRS LINGUISTIQUES
Jacqueline Léon
jleon at LINGUIST.UNIV-PARIS-DIDEROT.FR
Wed Mar 12 20:50:40 UTC 2014
Chères et chers collègues,
Nous vous prions de trouver ci joint lappel pour le Colloque SHESL-HTL 2015.
Cordialement
Pour le comité
Jacqueline Léon
***************************************************
« CORPUS ET CONSTITUTION DES SAVOIRS LINGUISTIQUES »
http://shesl-htl2015.sciencesconf.org
Dates : vendredi 30 et samedi 31 janvier 2015
Lieu : Paris
* Partenaires : SHESL (Société dHistoire et dÉpistémologie des Sciences du
Langage), HTL « Histoire des Théories Linguistiques » (UMR 7597), LLL «
Laboratoire Ligérien de Linguistique » (UMR 7270)
* Organisateurs : Gabriel Bergounioux, Bernard Colombat, Jacqueline Léon
* Comité scientifique : Émilie Aussant, Olivier Baude, Gabriel Bergounioux,
Danielle Candel, Bernard Colombat, Pascal Cordereix, Anne Grondeux, Bernard
Laks, Jacqueline Léon, Franck Neveu, Jean-Marie Pierrel, Valérie Raby, Benoît
Sagot
* Comité dorganisation : Émilie Aussant, Gabriel Bergounioux, Valentina
Bisconti, Danielle Candel, Bernard Colombat, Chloé Laplantine, Jacqueline Léon,
Pascale Rabault-Feuerhahn, Valérie Raby, Audrey Viault
Calendrier :
1er juin : délai de soumission de rigueur
10 juillet : réponse aux auteurs des propositions
Les propositions de communication, de 500 mots plus bibliographie et mots-clés,
sont à envoyer (avec comme objet du message SHESL_HTL 2015) aux trois
responsables :
- Gabriel Bergounioux <gabriel.bergounioux at univ-orleans.fr>
- Bernard Colombat <bernard.colombat at linguist.univ-paris-diderot.fr>
- Jacqueline Léon <jleon at linguist.univ-paris-diderot.fr>
** Informations sur le colloque : http://shesl-htl2015.sciencesconf.org/
** Présentation
Actualité des corpus linguistiques
La référence aux corpus est devenue lune des orientations méthodologiques
majeures de la linguistique contemporaine en lien avec le développement de la
numérisation et le recours aux outils de traitement automatique. Pour en donner
un exemple dans lactualité scientifique, on constate quen lespace de deux ans
en France, ce domaine a bénéficié dune Infrastructure de Recherche (IR Corpus)
déclinée en plusieurs consortiums, dun Equipex (Ortolang) et dun appel de
lANR (Corpus en SHS). Avec le projet Huma-Num et la mise en place de Dariah et
de CLARIN, cest au niveau européen que la question se trouve transposée.
Questions possibles
Lintérêt actuel pour les corpus correspond-il à une réflexion épistémologique ?
Une approche fondée sur des corpus peut-elle être qualifiée de strictement
empirique ou répond-elle à des exigences théoriques spécifiques ?
Quel est le statut des corpus en tant que producteurs de données dans la
construction dune représentation linguistique ? En quoi contribuent-ils à la
cumulativité des connaissances ?
En quoi lélaboration de corpus implique-t-elle une instrumentation des langues
(par ex. les outils de transcription) et comment participent-ils à la mise au
point de grammaires, à la rédaction de dictionnaires et aux développements du
TAL ?
Quels sont les effets des données de corpus sur les théories et les écoles ?
Quels manques résulteraient de leur absence ? Ces données sont-elles centrales,
incontournables, exclusives, ou, au contraire, complémentaires, annexes,
périphériques, etc. ? Quelles preuves peut-on en donner dans les recherches
actuelles ?
Laccroissement et la diversification des données apportées par les corpus
contribuent-ils à lamélioration de la théorisation ?
Histoire du travail sur les données
Le travail sur des données destinées à létablissement, la collation, la
vérification et lanalyse des faits linguistiques est une pratique ancienne.
Elle correspond dabord à une tradition philologique et exégétique,
ininterrompue de lAntiquité à nos jours, qui reste liée à la fondation des
bibliothèques et des dépôts darchives comme à la rédaction des compilations
(par ex. les Alexandrins, les Bénédictins). Cette relation des lettrés au
classement et à lexploitation des documents se retrouverait dans la plupart
des civilisations, en particulier en Orient.
Questions possibles
Quelle signification accorder au changement déchelle selon que le travail sur
les langues se fait au travers déchantillons limités ou de corpus importants ?
En dautres termes, peut-on parler de « grammaires de corpus », qui proposent
une représentation des langues en extension, lobjet produit constituant par
lui-même un corpus ? Si lexistence de tels objets est avérée, depuis quand
existent-ils et dans quelles traditions ? Inversement, comment se décide la
justification de théories qui se dispensent dun tel recours aux données ?
Comment et pourquoi se sont constitués les corpus dinscriptions ? Les données
épigraphiques par exemple répondent-elles simplement à un besoin de recensement
et dexhaustivité, ou posent-elles des problèmes linguistiques pour ceux qui les
ont créées et/ou ceux qui les exploitent ?
Extension aux langues du monde
Avec lexpansionnisme européen, laccumulation qui existe dans dautres
traditions sest étendue à un travail de description des langues que
transforment lusage des techniques denregistrement (à la fin du XIXe siècle)
et lapplication, sur les récits recueillis, de méthodes de transcription et de
segmentation pour lesquelles le Handbook of American Indian Languages demeure
emblématique. Dans son acception moderne, la linguistique de corpus semble
connaître un nouvel essor et une nouvelle définition dans une linguistique de
terrain aux préoccupations anthropologiques (aux États-Unis) ou à visée de
planification (en Russie).
Questions possibles
Au moment de la grammatisation massive des vernaculaires, comment sest effectué
le passage déchantillons limités (les collections de Notre Père par exemple) à
des données plus importantes ?
Quels ont été les principes opératoires dans la création des nouvelles données ?
Comment ces données sont-elles organisées et quel est leur statut ? En quoi leur
finalité est linguistique (et non folklorique ou ethnographique) ? En quoi se
distinguent-elles dautres outils comme la cartographie ?
La constitution des grandes bases de données modernes
Lautomatisation des corpus commence dans les années 1960 et pose les questions
déchantillonnage (vs textes intégraux), de recherche systématique de
structures. À partir de la fin des années 1980, de grandes masses de données
sont devenues disponibles grâce au développement technologique des ordinateurs
et à un perfectionnement des logiciels.
Questions possibles
Quels sont les critères qui permettent de définir ces grandes masses de données
comme étant des « corpus » ? En quoi induisent-elles un changement dans
lécologie de la pratique linguistique, notamment dans la division du travail
scientifique ?
Quels sont les fondements épistémologiques des corpus de référence et quels sont
leurs principes de légitimation ?
En quoi la place croissante donnée aux corpus oraux dans les langues à tradition
écrite peut-elle aboutir à un renversement des perspectives ?
Les « métacorpus »
Parallèlement, la numérisation des ouvrages légitime les entreprises
daccumulation des sources écrites et des documents sur la représentation des
langues, comme le montre lexemple du CTLF et du Corpus des grammaires
françaises, affectant, après les langues, le métalangage.
Questions possibles
Quel est le rôle de ces outils dans la construction de la représentation des
langues ?
Permettent-ils de modifier, dinfléchir ou daffiner cette représentation ?
--
Jacqueline Léon
Directrice de recherche CNRS
UMR7597 Histoire des Théories Linguistiques
Université Paris Diderot
case 7034
5 rue Thomas Mann
75205 Paris cedex 13
http://htl.linguist.univ-paris-diderot.fr
-------------- next part --------------
An HTML attachment was scrubbed...
URL: <http://listserv.linguistlist.org/pipermail/parislinguists/attachments/20140312/44b54b88/attachment.htm>
More information about the Parislinguists
mailing list