Subvention et aide à la numérisation de corpus
Stéphane Robert
robert at VJF.CNRS.FR
Thu Mar 8 18:20:45 UTC 2007
Subvention et aide à la numérisation de corpus
Cher(e) collègue,
Pour la deuxième année, la Fédération Typologie et Universaux Linguistique
souhaite répondre à loffre qui lui a été faite par la Délégation Générale
à la Langue Française et aux Langues de France (Ministère de la Culture) de
conclure un marché «Numérisation». Ce contrat sous forme de marché est
d'abord destiné à subventionner la numérisation de corpus en "langues de
France" (liste établie par la DGLF-LF, voir ci-dessous) afin d'en permettre
la préservation. Ces corpus peuvent être également des vidéos. Outre cette
numérisation "brute", ce marché permet également de subventionner une
valorisation de ces corpus numérisés sous la forme de transcriptions,
traductions, annotations, développement de concordancier ou autres outils
d'exploitation. Il est possible également de numériser des carnets de notes
de terrain. La DGLF-LF semble même prête à envisager de financer des
expositions sur ces corpus, dans le cadre de cette valorisation. En outre,
de courts extraits de ces corpus seraient affichés au sein d'un site
vitrine en cours de construction avec l'INIST. Enfin, ce plan numérisation
sera loccasion de (re)poser la question de larchivage des corpus, en
accord avec la direction du CNRS.
Comme lan dernier, la Fédération devrait pouvoir organiser la numérisation
des corpus proposés avec lappui du CRDO (Centre de Ressources pour la
Description de lOral) et utiliser les crédits qui seront disponibles pour
des vacations à cet effet. Si vous nous indiquez le nombre dheures et le
support de votre corpus, nous pouvons évaluer le coût de la numérisation et
donc le budget à demander. En revanche, pour ce qui est des traitements
supplémentaires (transcriptions, traduction, etc), cest à vous de nous
indiquer si vous pensez pouvoir les déléguer et quel budget il vous
faudrait pour faire exécuter ces tâches. Mais à ce stade, le plus urgent
nest pas de pouvoir chiffrer le coût mais de recenser les corpus qui
pourrraient être fournis.
Jinsiste: il ne sagit pas de numériser vous-même vos corpus, au
contraire, ce contrat avec la DGFL-LF constitue une occasion importante
pour financer et organiser la préservation de vos corpus. Si vous êtes
intéressé par cette offre, veuillez envoyer au plus tôt à Natacha Vellut
(natacha.vellut at ivry.cnrs.fr) un document indiquant:
- votre nom, laboratoire de rattachement
- adresse électronique
- nature du corpus: langue, type de texte, type de support
- volume du corpus (nombre d'heures ou de minutes d'enregistrement: les
petits corpus sont également bienvenus)
- date à laquelle vous pouvez fournir les corpus à numériser
- opérations envisagées: numérisation; traitement supplémentaire:
transcription, traduction, annotation, autre...
- éventuellement, chiffrage du coût des traitements supplémentaires
La liste des langues concernées est donnée ci-dessous.
La DGFL-LF doit décider courant mars des corpus éligibles, d'où ce délai
très court dont nous vous prions de nous excuser. Cela devrait néanmoins
nous permettre de vous donner une réponse au sujet du financement d'ici fin
mars.
Bien cordialement
Stéphane Robert
____________
LISTE DES LANGUES DE FRANCE
France métropolitaine
Langues régionales : alsacien, basque, breton, catalan, corse, flamand
occidental, francique mosellan, francoprovençal, langues doïl
(franc-comtois, wallon, champenois, picard, normand, gallo,
poitevin-saintongeais, lorrain, bourguignon-morvandiau), parlers doc ou
occitan (gascon, languedocien, provençal, auvergnat, limousin, vivaro-alpin).
Langues non-territoriales : arabe dialectal, arménien occidental, berbère,
judéo-espagnol, romani, yiddish.
Outre-mer
Zone caraïbe :
Créoles à base lexicale française : guadeloupéen, guyanais, martiniquais,
réunionnais ;
Créoles bushinenge de Guyane (à base lexicale anglo-portugaise) : saramaca,
aluku, njuka, paramaca ;
Langues amérindiennes de Guyane : galibi (ou kalina), wayana, palikur,
arawak (ou Iokono), wayampi, émerillon ;
Hmong.
Nouvelle Calédonie : vingt-huit langues canaques.
Grande terre : nyelâyu, kumak, caac, yuaga, jawe, nemi, fwâi, pije,
pwaamei, pwapwâ, langue de Voh-Koné, cèmuhi, paicî, ajië, arhâ, arhö,
ôrôwe, neku, sîchë, tîrî, xârâcùù, xaragurè, drubéa, numèè ;
Iles Loyauté : nengone, drehu, iaai, fagauvea.
Polynésie française : tahitien, marquisien, langue des Tuamotu, langue
mangarévienne, langues des Iles Australes : langue de Raivavae, langue de
Rapa, langue de Ruturu.
Iles Wallis et Futuna : wallisien, futunien.
Mayotte : mahorais, malgache de Mayotte.
La langue des signes française (LSF)
-------------- next part --------------
An HTML attachment was scrubbed...
URL: <http://listserv.linguistlist.org/pipermail/parislinguists/attachments/20070308/3ebc6019/attachment.htm>
More information about the Parislinguists
mailing list