Job: informatique, manipulation de donnees

Thierry Hamon thierry.hamon at LIPN.UNIV-PARIS13.FR
Tue Oct 21 12:33:55 UTC 2008


Date: Tue, 21 Oct 2008 12:37:59 +0200
From: Thierry.Poibeau at lipn.univ-paris13.fr
Message-ID: <20081021123759.6jfcf8k2vu7j4gcw at intranet.lipn.univ-paris13.fr>


Projet ENFLANG
Réalisation informatique (mission de 3 mois)

Le but de la mission est de mettre au point un outil d'interrogation
et de visualisation de données XML en utilisant des outils de type
XQuery et XSLT.  Le travail sera implémenté sous forme client/serveur,
les formulaires d'interrogation et les filtres de visualisation de
données seront manipulés uniquement par l'intermédiaire d'un
navigateur internet. Tous les travaux réalisés utiliseront des
logiciels opensource.

Les données XML sur lesquelles porte le projet sont des transcriptions
de corpus de langage oral (principalement des enfants en interactions
avec des adultes ou d'autres enfants). Ces données sont générées
automatiquement par des logiciels spécialisés comme CLAN, PHON,
ELAN. Le travail à réaliser utilisera le format CHILDES-XML, auquel on
devra rajouter certaines extensions spécifiques pour inclure des
métadonnées. Les formulaires de visualisation et d'inclusion des
métadonnées seront à réaliser.

Les outils d'interrogation porteront sur des ensembles de données XML
à gérer en bases XML. Les interrogations porteront sur des champs
spécifiques préfinis (avec combinaisons multiples de champs ?
inclusion, exclusion, concordance, etc.). L'interrogation pourra aussi
proposer des champs à l'utilisateur (sur certains niveaux spécifiques
des hiérarchies de données). Les résultats d'interrogation seront du
même format XML que les données interrogées, afin de pouvoir être
visualisées à l'aide des mêmes outils.

Les outils de visualisation pourront être les mêmes outils que ceux
qui servent à éditer les données XML (vérification des compatibilités
de format et appel de programme externe). Des outils complémentaires
de visualisation immédiate dans un navigateur internet seront
réalisés, en particulier pour obtenir des formats de présentation
différents de ceux des logiciels d'édition de corpus. Les données XML
faisant référence à des données sons et vidéo, l'inclusion de ces
données dans les visualisations est envisagée. La dernière partie de
la mission consistera à réaliser une description et une étude de
faisabilité de la présentation en direct des données vidéo (et dans la
mesure du possible une version prototype).

Besoins : Connaissances XQuery, XSLT, HTML et java. Connaissances
format vidéo (Quicktime) appréciées.

Réalisation : contrôle des données XML (1 semaine), insertion de
méta-données (1 semaine), interrogation des données XML (1 mois),
visualisation des données XML (1 mois), faisabilité de visualisation
vidéo (2 semaines).

Temps total 3 mois.

Contact : Christophe Parisse (cparisse at u-paris10.fr), Aliyah
Morgenstern (aliyah.morgenstern at gmail.com)

-------------------------------------------------------------------------
Message diffuse par la liste Langage Naturel <LN at cines.fr>
Informations, abonnement : http://www.atala.org/article.php3?id_article=48
English version       : 
Archives                 : http://listserv.linguistlist.org/archives/ln.html
                                http://liste.cines.fr/info/ln

La liste LN est parrainee par l'ATALA (Association pour le Traitement
Automatique des Langues)
Information et adhesion  : http://www.atala.org/
-------------------------------------------------------------------------



More information about the Ln mailing list