Subvention et aide à la numérisation de corpus

Stéphane Robert robert at VJF.CNRS.FR
Thu Mar 8 18:20:45 UTC 2007


Subvention et aide à la numérisation de corpus

Cher(e) collègue,

Pour la deuxième année, la Fédération Typologie et Universaux Linguistique 
souhaite répondre à l’offre qui lui a été faite par la Délégation Générale 
à la Langue Française et aux Langues de France (Ministère de la Culture) de 
conclure un marché «Numérisation». Ce contrat sous forme de marché est 
d'abord destiné à subventionner la numérisation de corpus en "langues de 
France" (liste établie par la DGLF-LF, voir ci-dessous) afin d'en permettre 
la préservation. Ces corpus peuvent être également des vidéos. Outre cette 
numérisation "brute", ce marché permet également de subventionner une 
valorisation de ces corpus numérisés sous la forme de transcriptions, 
traductions, annotations, développement de concordancier ou autres outils 
d'exploitation. Il est possible également de numériser des carnets de notes 
de terrain. La DGLF-LF semble même prête à envisager de financer des 
expositions sur ces corpus, dans le cadre de cette valorisation. En outre, 
de courts extraits de ces corpus seraient affichés au sein d'un site 
vitrine en cours de construction avec l'INIST. Enfin, ce plan numérisation 
sera l’occasion de (re)poser la question de l’archivage des corpus, en 
accord avec la direction du CNRS.

Comme l’an dernier, la Fédération devrait pouvoir organiser la numérisation 
des corpus proposés avec l’appui du CRDO (Centre de Ressources pour la 
Description de l’Oral) et utiliser les crédits qui seront disponibles pour 
des vacations à cet effet. Si vous nous indiquez le nombre d’heures et le 
support de votre corpus, nous pouvons évaluer le coût de la numérisation et 
donc le budget à demander. En revanche, pour ce qui est des traitements 
supplémentaires (transcriptions, traduction, etc), c’est à vous de nous 
indiquer si vous pensez pouvoir les déléguer et quel budget il vous 
faudrait pour faire exécuter ces tâches. Mais à ce stade, le plus urgent 
n’est pas de pouvoir chiffrer le coût mais de recenser les corpus qui 
pourrraient être fournis.

J’insiste: il ne s’agit pas de numériser vous-même vos corpus, au 
contraire, ce contrat avec la DGFL-LF constitue une occasion importante 
pour financer et organiser la préservation de vos corpus. Si vous êtes 
intéressé par cette offre, veuillez envoyer au plus tôt à Natacha Vellut 
(natacha.vellut at ivry.cnrs.fr) un document indiquant:

- votre nom, laboratoire de rattachement
- adresse électronique
- nature du corpus: langue, type de texte, type de support
- volume du corpus (nombre d'heures ou de minutes d'enregistrement: les 
petits corpus sont également bienvenus)
- date à laquelle vous pouvez fournir les corpus à numériser
- opérations envisagées: numérisation; traitement supplémentaire: 
transcription, traduction, annotation, autre...
- éventuellement, chiffrage du coût des traitements supplémentaires

La liste des langues concernées est donnée ci-dessous.

La DGFL-LF doit décider courant mars des corpus éligibles, d'où ce délai 
très court dont nous vous prions de nous excuser. Cela devrait néanmoins 
nous permettre de vous donner une réponse au sujet du financement d'ici fin 
mars.

Bien cordialement

Stéphane Robert
____________


LISTE DES LANGUES DE FRANCE

France métropolitaine

Langues régionales : alsacien, basque, breton, catalan, corse, flamand 
occidental, francique mosellan, francoprovençal, langues d’oïl 
(franc-comtois, wallon, champenois, picard, normand, gallo, 
poitevin-saintongeais, lorrain, bourguignon-morvandiau), parlers d’oc ou 
occitan (gascon, languedocien, provençal, auvergnat, limousin, vivaro-alpin).
Langues non-territoriales : arabe dialectal, arménien occidental, berbère, 
judéo-espagnol, romani, yiddish.

Outre-mer
Zone caraïbe :
Créoles à base lexicale française : guadeloupéen, guyanais, martiniquais, 
réunionnais ;
Créoles bushinenge de Guyane (à base lexicale anglo-portugaise) : saramaca, 
aluku, njuka, paramaca ;
Langues amérindiennes de Guyane : galibi (ou kalina), wayana, palikur, 
arawak (ou Iokono), wayampi, émerillon ;
Hmong.
Nouvelle Calédonie : vingt-huit langues canaques.
Grande terre : nyelâyu, kumak, caac, yuaga, jawe, nemi, fwâi, pije, 
pwaamei, pwapwâ, langue de Voh-Koné, cèmuhi, paicî, ajië, arhâ, arhö, 
ôrôwe, neku, sîchë, tîrî, xârâcùù, xaragurè, drubéa, numèè ;
Iles Loyauté : nengone, drehu, iaai, fagauvea.
Polynésie française : tahitien, marquisien, langue des Tuamotu, langue 
mangarévienne, langues des Iles Australes : langue de Ra’ivavae, langue de 
Rapa, langue de Ruturu.
Iles Wallis et Futuna : wallisien, futunien.
Mayotte : mahorais, malgache de Mayotte.

La langue des signes française (LSF)


-------------- next part --------------
An HTML attachment was scrubbed...
URL: <http://listserv.linguistlist.org/pipermail/parislinguists/attachments/20070308/3ebc6019/attachment.htm>


More information about the Parislinguists mailing list