Stage: Conception de documents textuels illustres (H/F), ELDA

Thierry Hamon thierry.hamon at UNIV-PARIS13.FR
Sun Dec 18 13:27:57 UTC 2011


Date: Thu, 15 Dec 2011 11:27:44 +0100
From: ELRA ELDA Information <info at elda.org>
Message-ID: <4EE9CBA0.6000905 at elda.org>
X-url: http://www.elda.org/


ELDA (Evaluation and Language resources Distribution Agency, 
www.elda.org <http://www.elda.org/>) a pour activités principales la 
distribution et la production de ressources linguistiques, ainsi que 
l'évaluation de technologies de la langue.

Dans le cadre de ses activités de production, ELDA offre 1 stage de
concepteur de documents textuels illustrés (H/F).

Contexte

ELDA participe à un projet visant à évaluer les systèmes d'analyse
automatique des documents écrits. Pour les systèmes en compétition, il
s'agit de répondre automatiquement aux questions suivantes :

  * Comment le document est-il structuré (zones de texte, images...) ?

  * Quelles sont les écritures présentes, avec leur type
    (manuscrit/dactylo) et leur langue (Français, Anglais, Arabe, autre)?

  * Quelles sont les informations principales du documents (auteur,
    destinataire, objet, date...) ?

Afin de disposer de données pour l'évaluation des systèmes d'analyse
automatique, des documents originaux sont collectés. Rédigés par des
volontaires (rémunérés) sous une identité fictive qui leur est
attribuée, ces documents se basent sur des scénarios fictifs et des
modèles de documents crées par ELDA (formulaires, bon de commande, page
de catalogue, tract politique ou commercial, carte de voeux,
en-têtes...).

Une fois collectés, ces documents font l'objet d'une description
manuelle de leur contenu, afin de pouvoir comparer l'analyse automatique
des systèmes avec les performances humaines.


Mission

Sous la responsabilité du chef de projet, le candidat réalisera les
modèles de document nécessaires à la rédaction des documents à
collecter. Les modèles peuvent être :

  * des fichiers images que les volontaires devront imprimer puis
    compléter manuellement ;

  * des fichiers .doc ou .ppt à compléter électroniquement (saisie au
    clavier) avant impression ;

  * des lettres-types au format image guidant la rédaction de courriers
    manuscrits ou dactylo.

Selon ses compétences, le stagiaire pourra également intervenir sur
d'autres aspects du projet, comme la maintenance du site web de collecte
(php/mySQL), la validation des documents collectés, ou encore leur
annotation (i.e. la description des documents via un logiciel dédié).


Profil recherché

  * Formation universitaire ou ingénieur

  * Maîtrise de l'édition sous Word et Powerpoint

  * Compétences en traitement d'image (Gimp/Photoshop, gestion des
    formats)

  * Qualités rédactionnelles : orthographe, grammaire, inspiration
    (invention des scénarios fictifs)

  * Un bon niveau d'anglais et/ou d'arabe constitue un plus (afin de
    réaliser/décliner les modèles dans les 2 autres langues du projet,
    le français étant la langue principale).

Durée : Stage long (4 mois minimum)

Ce stage, basé à Paris-13e (RER Cité universitaire), est à pourvoir
avant le printemps 2012.

Les candidatures (CV, lettre de motivation) doivent être adressées à
Matthieu Carré (carre at elda.org). Elles seront étudiées à partir de
janvier 2012.

-------------------------------------------------------------------------
Message diffuse par la liste Langage Naturel <LN at cines.fr>
Informations, abonnement : http://www.atala.org/article.php3?id_article=48
English version       : 
Archives                 : http://listserv.linguistlist.org/archives/ln.html
                                http://liste.cines.fr/info/ln

La liste LN est parrainee par l'ATALA (Association pour le Traitement
Automatique des Langues)
Information et adhesion  : http://www.atala.org/
-------------------------------------------------------------------------



More information about the Ln mailing list