Info: Charte Ethique & Big Data

Thierry Hamon thierry.hamon at UNIV-PARIS13.FR
Sat Jun 8 07:56:35 UTC 2013


Date: Wed, 5 Jun 2013 18:14:16 +0200 (CEST)
From: Karen Fort <karen.fort at loria.fr>
Message-ID: <197789038.3242875.1370448856558.JavaMail.root at loria.fr>
X-url: http://wiki.ethique-big-data.org

Charte Éthique & Big Data 

Suite à plusieurs articles [1, 2, 3] mettant en avant les problèmes
d'éthique, de droit et de qualité, liés à l'utilisation du Crowdsourcing
pour la constitution de ressources langagières, des chercheurs et des
industriels se sont réunis afin de proposer un moyen pratique d'encadrer
la production de corpus, et de limiter ces problèmes récurrents de
droit, d'éthique, de traçabilité, de qualité etc qui sont attachés à
cette activité.

La charte dont nous annonçons ici la parution est le résultat du travail
de ce groupe.

Valoriser les grands volumes de données 

La charte est une co‐construction d’acteurs majeurs, académiques et
industriels, pour faciliter la création, la diffusion et l'utilisation
des grands volumes de données (Big Data) et participer ainsi à leur
valorisation.

Une réponse concrète à de nouveaux enjeux 

La création, la maintenance, la diffusion et l'utilisation de données de
toutes sortes est un enjeu majeur. Qu'il s'agisse de corpus de parole,
de données démographiques, personnelles, de relevés de capteurs, de
documents, thésaurus, ontologies. Ces bases de données sont essentielles
à la recherche, mais également à la création et la maintenance de
nouveaux services. Cependant, l'utilisation ou la réutilisation des
données se heurtent trop souvent à des freins qui en empêchent
l'exploitation optimale : provenance parfois opaque, éthique douteuse,
traçabilité inexistante, protection intellectuelle incertaine, une
qualité difficile à évaluer a priori. Dès lors, sécuriser la création de
données est un facteur de compétitivité et un devoir.

L’objectif de la charte Éthique & Big Data est de fournir des garanties
concernant la maintenabilité des données, leur traçabilité, leur
qualité, l'impact sur l'emploi, assurer l'éthique et réduire le risque
juridique. Elle vise à harmoniser les rapports entre producteurs,
fournisseurs et utilisateurs de données sur le plan du respect des lois,
de celui de l'éthique, et garantir la confiance dans les rapports entre
l'ensemble des acteurs impliqués.

Un travail à plusieurs voix 

Cette charte a été conçue à l’initiative de l’APROGED, de l’ATALA, de
l’AFCP et de CAP DIGITAL, par un groupe de travail animé par Alain
Couillaut. Plusieurs associations et partenaires ont collaboré à sa
rédaction et à sa diffusion. La charte comprend quatre volets : la
description des données, la traçabilité, la propriété intellectuelle et
les réglementations spécifiques.

Vers l'adoption ... 

Adoptée par les partenaires de l’Alliance Big Data, la Charte Éthique &
Big Data l’est déjà également par des producteurs de données du secteur
de la recherche. Elle est diffusée sous licence Creative Common et est
disponible sur le wiki http://wiki.ethique-big-data.org .  Cette version
est une première étape : les travaux continuent pour l’optimiser afin de
répondre de façon plus complète aux différents besoins.

Alain Couillault, Gilles Adda, Karën Fort, Hugues de Mazancourt 
au nom des rédacteurs de la charte 

[1] G. Adda, J. Mariani Language resources and Amazon Mechanical Turk:
legal, ethical and other issues LISLR2010, ``Legal Issues for Sharing
Language Resources workshop'', LREC2010, Malta, 17 mai 2010 
[2] K. Fort, G. Adda, K. Bretonnel-Cohen Amazon mechanical Turk: gold
mine or coal mine? Computational Linguistics, 2011, vol. 37, n°2,
413-420 
[3] B. Sagot, K. Fort, G. Adda, J-J. Mariani, B. Lang, Un turc mécanique
pour les ressources linguistiques : critique de la myriadisation du
travail parcellisé 18ème Conférence sur le Traitement Automatique des
Langues Naturelles (TALN 2011), Montpellier, France, du au 2011. 

Karën Fort 
ATER ENSMN 
Loria, équipe Sémagramme 
Bureau C303 
+33 (0)3 54 95 86 54 
http://www.loria.fr/~fortkare/ 

-------------------------------------------------------------------------
Message diffuse par la liste Langage Naturel <LN at cines.fr>
Informations, abonnement : http://www.atala.org/article.php3?id_article=48
English version       : 
Archives                 : http://listserv.linguistlist.org/archives/ln.html
                                http://liste.cines.fr/info/ln

La liste LN est parrainee par l'ATALA (Association pour le Traitement
Automatique des Langues)
Information et adhesion  : http://www.atala.org/
-------------------------------------------------------------------------



More information about the Ln mailing list