Job: Two internships in computational linguistics (Dutch/Italian) for master-students, France Telecom (Lannion)
Thierry Hamon
thierry.hamon at LIPN.UNIV-PARIS13.FR
Fri Mar 31 12:18:49 UTC 2006
Date: Wed, 29 Mar 2006 11:20:20 +0200
From: "MAILLEBUAU Estelle RD-TECH-LAN" <estelle.maillebuau at francetelecom.com>
Message-ID: <B30D6148F304A743A53B9B44751CDB9A03EE36DE at FTRDMEL2.rd.francetelecom.fr>
The natural language processing R&D team of France Telecom in Lannion
(Brittany, France) is offering one or two internships for
master-students. The internship will last for five months and may
begin as soon as possible.
The two subjects are
* Compiling linguistic data for Italian
* Compiling linguistic data for Dutch
In both cases linguistic data have to be adapted for the NLP software
developped by France Telecom, notably
* Electronic lexicons (which include inflectional as well as
morpho-syntactical information)
* Chunk grammars
The lexicons will be generated semi-automatically (based on word-lists
and corpora) and have to be validated manually. They will be tuned by
configuring and testing a automatic summarizer for the language
studied.
Candidates should follow a Master-course of computational linguistics
and have a profound knowledge of the Italian or Dutch language.
Further requirements include knowledge scripting languages on
Unix-based operating systems.
The working languages are French or English; the working place will be
Lannion (Northern Brittany, France)
The successful candidates will be paid.
Please send any inquiries you may have and your applications to
estelle(dot)maillebuau(at)francetelecom(dot)com
johannes(dot)heinecke(at)francetelecom(dot)com
------------------------------------------------------------------------
La Division Recherche & Développement de France Télécom à Lannion,
recherche un ou deux candidats(es) pour un stage de fin d'étude
(bac+5), d'une durée de 5 mois, au sein de l'unité de recherche
"Langues Naturelles" :
SUJET 1 : Constitution de ressources linguistiques pour l'italien
SUJET 2 : Constitution de ressources linguistiques pour le néerlandais
Il s'agira de mettre au point les ressources linguistiques utilisées
par les logiciels de TALN de l'équipe sur les langues italienne et
néerlandaise :
* un lexique comportant les informations flexionnelles et
morpho-syntaxiques,
* et une grammaire de chunking.
L'acquisition lexicale se fera semi-automatiquement (exploitation de
listes de mots et/ou de corpus) et sera validée manuellement. Elle
sera complétée par la mise au point d'un logiciel de résumé
automatique sur chacune des langues citées.
Profil : linguistique informaticien(ne), bac +5 : master professionnel
ou recherche
Langue de travail : français ou anglais
Compétences requises : italien ou néerlandais, morphologie et syntaxe,
bonne connaissance du TALN, langages de scripts, environnement unix
Durée : 5 mois (début : dès que possible)
Lieu de travail : Lannion, Côtes d'Armor, Bretagne, France
Stage indemnisé
Contacts :
johannes(point)heinecke(at)francetelecom(point)com
estelle(point)maillebuau(at)francetelecom(point)com
-------------------------------------------------------------------------
Message diffusé par la liste Langage Naturel <LN at cines.fr>
Informations, abonnement : http://www.atala.org/article.php3?id_article=48
English version :
Archives : http://listes.cines.fr/wws/arc/ln
http://listserv.linguistlist.org/archives/ln.html
La liste LN est parrainée par l'ATALA (Association pour le Traitement
Automatique des Langues)
Information et adhésion : http://www.atala.org/
-------------------------------------------------------------------------
More information about the Ln
mailing list