Job: Linguiste annotateur, Weborama
Thierry Hamon
hamon at LIMSI.FR
Fri Sep 12 20:39:46 UTC 2014
Date: Fri, 12 Sep 2014 15:56:50 +0200
From: Rachid Ammari <ammari.rachid at gmail.com>
Message-ID: <CABNQchaVH=xOmBQy_qT3vRxYSmL871o3uZtKhEpbvdQnzygyvg at mail.gmail.com>
=====================
[JOB] Recherche freelance/auto-entrepreneur Linguiste annotateur pour
l'anglais, l'italien, le français, l'espagnol, le russe ou le
néerlandais.
=====================
Sujet
=====
Validation linguistique de clusters de mots pour une langue donnée pour
l'entreprise Weborama.
Description
===========
L'objectif est de constituer, valider et affiner des clusters de mots
par thématique. Ces clusters sont utilisés à des fins de ciblages
comportementaux anonymes.
Cet objectif passe par un enrichissement de lexique. L'annotateur sera
amené à constituer ou modifier des groupes de mots, que nous appelons
clusters, par thèmes (sports, cuisine, Téléphonie etc). Pour cela nous
utilisons un lexique interne que nous enrichissons. L'idée consiste donc
à ajouter des lemmes dans ces clusters thématiques.
Mais pour cela, les lemmes (et les flexions du mot) doivent être
présents dans le lexique. Le cluster contient donc que des lemmes. Il
faudra souvent ajouter des entités nommées (des lieux, des marques, des
personnalités...) au lexique afin de les ajouter aux clusters. Ou éditer
le lexique pour corriger des erreurs ou rediriger des formes fléchies
vers certains lemmes.
La mission linguistique est donc simple, la mission est principalement
une mission d'annotation. Toutefois il est important d'avoir une base de
linguistique pour gérer un lexique, repérer les mots polysémiques et
ambigus et pour bien lemmatiser.
On demandera aussi une grande autonomie et/ou culture afin d'agrémenter
les clusters les plus spécialisés. Par exemple enrichir une thématique
sport si on n'est pas un passionné de sport nécessite de faire des
recherches. Le tout étant destiné à un pays en particulier on prendra
bien soin d'orienter chacun des clusters vers la culture du pays.
Compétences requises
====================
- Langue maternelle parmi une des langues données : anglais américain,
russe, espagnol, italien ou néerlandais
- Connaissance en linguistique (lexicologie, sémantique)
- Autonomie et curiosité (pour chercher à ajouter des entrées concernant
des thématiques très spécifiques)
Type de contrat
===============
En général ce sont des missions payées à l'heure. C'est pourquoi le
statut d'auto-entrepreneur/freelance est préféré.
Localisation du poste
=====================
L'entreprise Weborama est basée à Paris (75019).
Toute la mission peut être réalisé en télétravail.
Comment postuler
================
Merci de faire parvenir votre candidature à l'adresse suivante en
précisant bien dans le sujet du mail la langue pour laquelle vous
postulez : rachid at weborama.com
-------------------------------------------------------------------------
Message diffuse par la liste Langage Naturel <LN at cines.fr>
Informations, abonnement : http://www.atala.org/article.php3?id_article=48
English version :
Archives : http://listserv.linguistlist.org/archives/ln.html
http://liste.cines.fr/info/ln
La liste LN est parrainee par l'ATALA (Association pour le Traitement
Automatique des Langues)
Information et adhesion : http://www.atala.org/
ATALA décline toute responsabilité concernant le contenu des
messages diffusés sur la liste LN
-------------------------------------------------------------------------
More information about the Ln
mailing list