[Corpora-List] Job Opening: research engineer (fluent French) in computational linguistics / NLP

Loïc Liégeois loic-liegeois at hotmail.fr
Fri May 3 12:54:02 UTC 2013


The projet CoMéRé (Communication Médiée par les Réseaux) is currently
recruiting a research engineer for a seven-month contract (June -Dec 2013
with possibility for prolongation) in Clermont-Ferrand, France.

CoMéRé is a French  project (http://corpuscomere.wordpress.com) of a
national workgroup that aims to gather French CMC (computer-mediated
communication) corpora. The structured corpora, alongside their TEI
metadata, will be deposited on a national server (Ortolang) in the form of
an open-access repository and will be integrated into the future reference
corpus of French.

A job description is given below.

------------------------------------------
*

CDD assistant de recherche avec l'aide de l'IR Corpus-écrits et Ortolang

Titre
*Ingénieur pour la structuration de corpus de communications en ligne

*Lieu de travail
*Laboratoire de Recherche sur le Langage (LRL), EA999
Université Blaise Pascal
Maison des Sciences de l’Homme
4, rue Ledru
63057 Clermont-Ferrand cedex 01
Toile : http://lrl.univ-bpclermont.fr

*Profil
Qualification et compétences appréciées
*·         Compétences pour le travail en groupe au sein d’un projet
national
·         Expérience en XML et schémas associés
·         Expérience dans les langages de transformation de corpus (XSLT…)
·         Connaissance des schémas de structuration de corpus du type TEI
·         Expérience appréciée dans des langages de programmation de
traitement de chaînes type Perl, Python
·         Maîtrise appréciée de l’anglais niveau B2 minimum.

*Tâches
*·         Structuration de corpus existants sur des communications médiées
par les réseaux en TEI
·         Contribution au choix des structures de TEI adaptées aux types de
corpus
·         Traitements d’anonymisation simples sur les corpus bruts
·         Aide à la collecte automatique de nouveaux corpus en ligne.

*Type de contrat
*Contrat CDD niveau ingénieur d'étude de 6 mois à temps plein
(juin-novembre 2013), extension jusqu'en décembre à confirmer. Prolongation
du contrat sur 2014 à discuter
Salaire mensuel
1700 euros brut
1350 euros net

*Descriptif de la mission
*CoMeRe est un projet national (
http://corpuscomere.wordpress.com<http://corpuscomere.wordpress.com/>)
du groupe de travail sur les nouvelles formes de communication du
consortium corpus-écrits (
http://corpusecrits.corpus-ir.fr/<http://corpusecrits.corpus-ir.fr/>
).
Il a pour but de collecter et mettre en ligne des corpus de Communication
Médiée par les Réseaux (CoMeRe – CMC en anglais) suivant les standards
internationaux, à horizon 2014 sur le site Ortolang. Ce noyau de corpus
sera alors intégré au futur*Corpus de Référence du français*.
Le projet rassemble des chercheurs appartenant à une dizaine d’unités
nationales différentes. Il est coordonné au sein de l’unité LRL. CoMeRe a
reçu le soutien de Corpus-écrits et de l’équipement d’excellence  Ortolang (
http://www.ortolang.fr ).
La personne recrutée travaillera en contact permanent avec les chercheurs
de CoMeRe qui déposeront leurs corpus sur les serveurs du LRL. Elle aura
pour tâche principale de les structurer suivant les standards adoptés par
le projet en partenariat avec nos partenaires européens au sein du
consortium TEI. Elle participera à la collecte de nouveaux corpus en ligne
et aux réunions du projet.

*Candidature
*Lettre de motivation + CV
Contact
Thierry Chanier - Thierry.CHANIER at univ-bpclermont.fr

------------------------------------------
-------------- next part --------------
An HTML attachment was scrubbed...
URL: <http://listserv.linguistlist.org/pipermail/corpora/attachments/20130503/6476d3ed/attachment.htm>
-------------- next part --------------
_______________________________________________
UNSUBSCRIBE from this page: http://mailman.uib.no/options/corpora
Corpora mailing list
Corpora at uib.no
http://mailman.uib.no/listinfo/corpora


More information about the Corpora mailing list