Job: CDD temps partiel, Developpement site web annotation de corpus

Thierry Hamon thierry.hamon at UNIV-PARIS13.FR
Wed Sep 14 20:32:59 UTC 2011


Date: Wed, 14 Sep 2011 00:59:06 +0200
From: Pascal Vaillant <vaillant at laposte.net>
Message-Id: <201109140059.07185.vaillant at laposte.net>
X-url: http://jaxe.sourceforge.net/fr/
X-url: http://clapoty.vjf.cnrs.fr


-------------------------------

CNRS/SEDYL (Structure et Dynamique des Langues)


En appui pour l'un de nos projets de recherche (CNRS, ANR) [1], nous
proposons un CDD de 9 mois, à temps partiel, en informatique.


Spécialité recherchée :
-----------------------

Programmation web, bases de données.


Profil du candidat :
--------------------

Diplômé d'une licence pro, master ou école d'ingénieur en conception /
programmation / intégration web


Objectifs du travail :
----------------------

(1) maintenir et étendre le site web dynamique d'un projet, conçu pour
donner accès (en lecture et en écriture) à une base de données et à une
banque de textes structurés en XML.

(2) maintenir et étendre un éditeur de documents XML en logiciel libre,
configuré spécifiquement pour la manipulation des fichiers XML conformes
au schéma de documents du projet.

(3) faire des propositions ergonomiques d'intégration de certaines 
fonctions d'édition XML directement à partir du site web.


Techniques utilisées :
----------------------

(1) Le site web est implanté sur un serveur fonctionnant avec le système
GNU/Linux « Debian », et utilise le serveur HTTP Apache. Les scripts
engendrant dynamiquement les pages web sont écrits en PHP. Le format des
pages créées est HTML 4 + CSS 2 et comporte des éléments de JavaScript.

La base de données sous-jacente est gérée par le SGBD MySQL. Certaines
des données sont des liens URL vers des documents XML.

Les scripts PHP utilisent l'extension mysqli pour interagir avec la base
de données, et l'extension DOM pour manipuler dynamiquement les
documents XML (segmenter, modifier, extraire de l'information).

(2) L'éditeur XML utilisé est basé sur JAXE
(http://jaxe.sourceforge.net/fr/),logiciel libre développé en Java par
Damien Guillaume (Observatoire de Meudon). JAXE étant un logiciel libre
disponible sous licence GPL, il peut être modifié et étendu pour les
besoins du projet.

Les documents XML manipulés dans le cadre de ce projet sont structurés
par un schéma de documents XML (XML Schema). À ce schéma est attaché un
fichier de configuration de JAXE, ainsi que des fonctions d'extension
("plug-ins") en Java.

Les documents XML, qui comportent des textes multilingues, sont encodés
en Unicode (UTF-8), et la conception du schéma de documents s'inspire de
normes déjà existantes pour la représentation structurée des textes
(TEI).

L'affichage des documents XML en ligne sur le site web est réalisé par
l'utilisation du langage XSLT/XPath.

Compétences techniques requises - résumé en mots-clés : Apache, PHP,
HTML, CSS, Javascript, SQL, XML, Java, XML Schema, TEI, Unicode, XSLT,
XPath.


Caractéristiques du travail :
-----------------------------

Le projet s'inscrit dans une démarche de recherche en linguistique
(étude des échanges multilingues où les locuteurs utilisent plusieurs
langues à la fois) ; il consiste à rassembler des textes, à permettre à
des spécialistes (linguistes et sociolinguistes) de les annoter, puis à
leur fournir des outils informatiques pour les étudier et mieux les
comprendre.

Le poste demande donc une aptitude à dialoguer avec des non-spécialistes
d'informatique, à analyser leurs besoins, et à leur présenter des
solutions sans jargon technique.

Le poste demande de savoir travailler en autonomie.

Par ailleurs, une curiosité intellectuelle dans le domaine des langues 
est un atout bienvenu.

Le projet est basé au Campus CNRS de Villejuif (métro ligne 7) avec une 
implication nécessaire de 3 jours par semaine (début de semaine si 
possible).

Le salaire est indexé sur les grilles du CNRS et dépend du niveau 
d'études du candidat. Le niveau attendu du candidat est un diplôme de 
licence pro, master ou école d'ingénieur. A titre de comparaison, un 
temps plein niveau bac est estimé à 1573 euros bruts (environ 1200 euros 
nets) - il s'agirait ici d'un 50 ou 70%, à discuter.

Les personnes intéressées doivent envoyer leur CV + lettre de motivation 
avant le 30 septembre 2011 à:

Pascal Vaillant : vaillant at vjf.cnrs.fr

Isabelle Léglise : leglise at vjf.cnrs.fr


[1] http://clapoty.vjf.cnrs.fr

-------------------------------------------------------------------------
Message diffuse par la liste Langage Naturel <LN at cines.fr>
Informations, abonnement : http://www.atala.org/article.php3?id_article=48
English version       : 
Archives                 : http://listserv.linguistlist.org/archives/ln.html
                                http://liste.cines.fr/info/ln

La liste LN est parrainee par l'ATALA (Association pour le Traitement
Automatique des Langues)
Information et adhesion  : http://www.atala.org/
-------------------------------------------------------------------------



More information about the Ln mailing list