Seminaire: Traces digitales, 6 fevrier 2014, Universite de Paris Est Marne la Vallee

Wed Jan 29 09:56:18 UTC 2014

Date: Mon, 27 Jan 2014 14:20:50 +0100
From: Nicolas Turenne <nturenne.inra at yahoo.fr>
Message-ID: <52E65D32.30604 at yahoo.fr>
X-url: http://www.inra-ifris.org/axes-de-recherche-thematique/groupe-plateforme-cortext/seminaire-de-l-axe-traces-digitales-groupe-cortext.html/

[désolé pour les réception multiples]

Chers collègues,

Dans le cadre de la quatorzième séance du séminaire 'traces digitales'
du groupe CorText, nous avons le plaisir d'accueillir /Mathieu Andro/
(Ingénieur de recherches, DV-IST , INRA) et Etinne Come (CR, Grettia -
IFFSTAR) de crowdsourcing et de visualisation de données.

Cette matinée aura lieu le *jeudi 6 février de 10h à 12h30*, dans la
salle de réunion C219 du Latts (Université Paris-Est Marne la Vallée -
rue Galilée, bâtiment du Bois de l'Etang - 2ème étage - aile C). /Voir
http://www.inra-ifris.org/axes-de-recherche-thematique/groupe-plateforme-cortext/seminaire-de-l-axe-traces-digitales-groupe-cortext.html/

10h-11h15 /Mathieu Andro/ ( ingénieur - doctorant, Direction de la
Valorisation / Information Scientifique et Technique (DV-IST) &
Laboratoire Hypermedia Univ. Paris 8 )

Crowdsourcing et numérisation

Abstract : Les humains passent de plus en plus de temps sur Internet.
Avec le développement du web 2.0, ils sont désormais en capacité de
contribuer activement au développement de contenus. De leur coté, les
bibliothèques disposent de moins en moins de ressources pour effectuer
le travail nécessaire à l'achèvement de leurs projets. Elles pourraient
donc, au lieu de sous-traiter une partie de leurs tâches auprès des pays
à bas coût qui remportent leurs appels d'offres, les externaliser auprès
de la foule des internautes qui compte des spécialistes dans tous les
domaines et des individus susceptibles de s'engager pour des raisons
aussi diverses que le développement personnel, la distraction, le jeu,
l'autopromotion ou l'altruisme et qui pourraient répondre à leurs appels
à participation. Le crowdsourcing implique néanmoins une évolution
majeure dans la culture de travail d'une corporation assez conservatrice
et qui pourrait se sentir dévalorisée si son travail est effectué
gratuitement et bénévolement par des amateurs et des profanes. Son
implémentation est particulièrement difficile en France où les modes de
fonctionnement participatifs ont parfois du mal s'imposer. Après une
recherche de définition du crowdsourcing, de son histoire, de sa
philosophie et de sa critique, un état de l'art de son application dans
les institutions culturelles sera proposé : numérisation à la demande,
correction participative de l'OCR, folksonomie. Enfin, quelques
expérimentations de crowdsourcing et de crowdfunding à la DV-IST de
l'Inra seront présentées.

11h15-12h30 /Etienne Come/ (Chargé de Recherches, Grettia, IFFSTAR)

Analyse et visualisation des données Vélib

Abstract : Cet exposé balaiera différentes études et visualisations
réalisées sur l'analyse des données enregistrées sur le système de Vélos
en Libre Sevice (VLS) de Paris appelé Vélib'. Nous présenterons tout
d'abord un travail consacré au clustering de stations suivant leur
profil d'usage temporel basé sur un modèle de mélange. Nous détaillerons
le modèle statistique ayant été développé pour prendre en considération
différentes particularités de l'application et présenterons les
résultats obtenus sur deux mois de données d'usage. Ces résultats
mettent clairement en évidence les relations entre type de localisation
et type d'usage. Ceci sera en particulier illustré grâce à une
visualisation de données permettant d'explorer de manière fine les
données origine destination étudiées et tirant partie du clustering
produit. Dans un second temps, nous verrons comment une technique
classique d'analyse de corpus textuel appelée "Latent Dirichlet
Allocation" peut être détournée pour étudier le comportement de matrice
Origine Destination dynamiques. Cette présentation sera elle aussi
accompagnée d'une analyse des résultats obtenus sur les données Vélib'.
Nous montrerons en particulier comment les résultats obtenus peuvent
être post traités afin de mettre en évidence les comportements typiques
en terme de flux de vélos du système. Nous terminerons par une
présentation de différentes visualisations de données permettant
d'explorer le comportement des systèmes de vélos en libre service.

-------------------------------------------------------------------------
Message diffuse par la liste Langage Naturel <LN at cines.fr>
Informations, abonnement : http://www.atala.org/article.php3?id_article=48
English version       : 
Archives                 : http://listserv.linguistlist.org/archives/ln.html
                                http://liste.cines.fr/info/ln

La liste LN est parrainee par l'ATALA (Association pour le Traitement
Automatique des Langues)
Information et adhesion  : http://www.atala.org/

ATALA décline toute responsabilité concernant le contenu des
messages diffusés sur la liste LN
-------------------------------------------------------------------------