Job: 2 offres de stage Bac+5, France Telecom R&D
Thierry Hamon
thierry.hamon at LIPN.UNIV-PARIS13.FR
Tue Oct 25 13:10:23 UTC 2005
Date: Fri, 21 Oct 2005 16:28:39 +0200
From: "GUIMIER DE NEEF Emilie RD-TECH-LAN" <emilie.guimierdeneef at francetelecom.com>
Message-ID: <49E7012A614B024B80A7D175CB9A64EC072A5125 at ftrdmel1.rd.francetelecom.fr>
La Division Recherche & Développement de France Télécom à Lannion,
recherche deux candidats(es) pour un stage de fin d'étude (bac+5),
d'une durée de 5 mois, au sein de l'unité de recherche "Langues
Naturelles" :
===========================================================
SUJET : Extraction terminologique en contextes applicatifs
Il s'agira de tester les outils d'extraction terminologique de
l'équipe et d'en affiner les données pour l'extraction de termes dans
différents types de corpus (presse écrite, base d'indexation,
etc.). Le problème du repérage sera couplé à celui du terme dans son
contexte : représentation sémantique du terme, classification
thématique, correspondances multilingues... L'extraction sera testée
dans différents contextes applicatifs. L'étudiant manipulera des
grammaires de dépendance, des lexiques et des ressources sémantiques.
Profil : linguistique informaticien(ne), bac +5 : master professionnel
ou recherche
Compétences requises : syntaxe, sémantique, langues étrangères,
langage de scripts, environnement unix
Durée : 5 mois (début : printemps 2006)
Contact : Emilie Guimier De Neef
emilie(point)guimierdeneef(at)francetelecom(point)com
<mailto:emilie.guimierdeneef at francetelecom.com>
===========================================================
SUJET : Adaptation de données linguistiques au besoin d'un corpus de
domaine
Il s'agira :
* d'analyser un corpus existant (anglais) et de constituer un
nouveau corpus (anglais et français) contenant des descriptions
textuelles d'images et de vidéos ainsi que des requêtes d'utilisateur.
* de mettre à jour les lexiques, grammaires de dépendance, données
sémantiques nécessaires pour assurer une analyse correcte des
descriptifs d'images et des requêtes
* d'évaluer les résultats
* et d'établir une procédure de tests (analyse du corpus, comparaison
des résultats obtenus avec les résultats souhaités)
Profil : linguistique informaticien(ne), bac +5 : master professionnel
ou recherche
Compétences requises : français et anglais nécessaires,
représentations lexicales, syntaxe de dépendance. La connaissance des
ontologies et des langages de programmation python, java ou c++ serait
un plus, environnement Unix/Linux.
Durée : 5 mois (début : printemps 2006)
Contact : Johannes Heinecke
johannes(point)heinecke(at)francetelecom(point)com
<mailto:johannes.heinecke at francetelecom.com>
-------------------------------------------------------------------------
Message diffusé par la liste Langage Naturel <LN at cines.fr>
Informations, abonnement : http://www.biomath.jussieu.fr/LN/LN-F/
English version : http://www.biomath.jussieu.fr/LN/LN/
Archives : http://listserv.linguistlist.org/archives/ln.html
La liste LN est parrainée par l'ATALA (Association pour le Traitement
Automatique des Langues)
Information et adhésion : http://www.atala.org/
-------------------------------------------------------------------------
More information about the Ln
mailing list