Job: 2 offres de stage Bac+5, France Telecom R&D

Thierry Hamon thierry.hamon at LIPN.UNIV-PARIS13.FR
Tue Oct 25 13:10:23 UTC 2005


Date: Fri, 21 Oct 2005 16:28:39 +0200
From: "GUIMIER DE NEEF Emilie RD-TECH-LAN" <emilie.guimierdeneef at francetelecom.com>
Message-ID: <49E7012A614B024B80A7D175CB9A64EC072A5125 at ftrdmel1.rd.francetelecom.fr>


La Division Recherche & Développement de France Télécom à Lannion,
recherche deux candidats(es) pour un stage de fin d'étude (bac+5),
d'une durée de 5 mois, au sein de l'unité de recherche "Langues
Naturelles" :

===========================================================
SUJET : Extraction terminologique en contextes applicatifs

Il s'agira de tester les outils d'extraction terminologique de
l'équipe et d'en affiner les données pour l'extraction de termes dans
différents types de corpus (presse écrite, base d'indexation,
etc.). Le problème du repérage sera couplé à celui du terme dans son
contexte : représentation sémantique du terme, classification
thématique, correspondances multilingues... L'extraction sera testée
dans différents contextes applicatifs. L'étudiant manipulera des
grammaires de dépendance, des lexiques et des ressources sémantiques.

Profil : linguistique informaticien(ne), bac +5 : master professionnel
ou recherche

Compétences requises : syntaxe, sémantique, langues étrangères,
langage de scripts, environnement unix

Durée : 5 mois (début : printemps 2006)

Contact : Emilie Guimier De Neef
emilie(point)guimierdeneef(at)francetelecom(point)com
<mailto:emilie.guimierdeneef at francetelecom.com> 

===========================================================

SUJET : Adaptation de données linguistiques au besoin d'un corpus de
domaine

Il s'agira :
* d'analyser un corpus existant (anglais) et de constituer un
  nouveau corpus (anglais et français) contenant des descriptions
  textuelles d'images et de vidéos ainsi que des requêtes d'utilisateur.

* de mettre à jour les lexiques, grammaires de dépendance, données
  sémantiques nécessaires pour assurer une analyse correcte des
  descriptifs d'images et des requêtes

* d'évaluer les résultats

* et d'établir une procédure de tests (analyse du corpus, comparaison
  des résultats obtenus avec les résultats souhaités)

Profil : linguistique informaticien(ne), bac +5 : master professionnel
ou recherche

Compétences requises : français et anglais nécessaires,
représentations lexicales, syntaxe de dépendance. La connaissance des
ontologies et des langages de programmation python, java ou c++ serait
un plus, environnement Unix/Linux.

Durée : 5 mois (début : printemps 2006)

Contact : Johannes Heinecke
johannes(point)heinecke(at)francetelecom(point)com
<mailto:johannes.heinecke at francetelecom.com> 


-------------------------------------------------------------------------
Message diffusé par la liste Langage Naturel <LN at cines.fr>
Informations, abonnement : http://www.biomath.jussieu.fr/LN/LN-F/
English version          : http://www.biomath.jussieu.fr/LN/LN/
Archives                 : http://listserv.linguistlist.org/archives/ln.html

La liste LN est parrainée par l'ATALA (Association pour le Traitement
Automatique des Langues)
Information et adhésion  : http://www.atala.org/
-------------------------------------------------------------------------



More information about the Ln mailing list