Job: Two internships in computational linguistics (Dutch/Italian) for master-students, France Telecom (Lannion)

Thierry Hamon thierry.hamon at LIPN.UNIV-PARIS13.FR
Fri Mar 31 12:18:49 UTC 2006


Date: Wed, 29 Mar 2006 11:20:20 +0200
From: "MAILLEBUAU Estelle RD-TECH-LAN" <estelle.maillebuau at francetelecom.com>
Message-ID: <B30D6148F304A743A53B9B44751CDB9A03EE36DE at FTRDMEL2.rd.francetelecom.fr>

The natural language processing R&D team of France Telecom in Lannion
(Brittany, France) is offering one or two internships for
master-students. The internship will last for five months and may
begin as soon as possible.

The two subjects are
*	Compiling linguistic data for Italian
*	Compiling linguistic data for Dutch

In both cases linguistic data have to be adapted for the NLP software
developped by France Telecom, notably

* Electronic lexicons (which include inflectional as well as
  morpho-syntactical information)

* Chunk grammars

The lexicons will be generated semi-automatically (based on word-lists
and corpora) and have to be validated manually. They will be tuned by
configuring and testing a automatic summarizer for the language
studied.

Candidates should follow a Master-course of computational linguistics
and have a profound knowledge of the Italian or Dutch language.
Further requirements include knowledge scripting languages on
Unix-based operating systems.

The working languages are French or English; the working place will be
Lannion (Northern Brittany, France)
The successful candidates will be paid.

Please send any inquiries you may have and your applications to 
estelle(dot)maillebuau(at)francetelecom(dot)com
johannes(dot)heinecke(at)francetelecom(dot)com


------------------------------------------------------------------------

La Division Recherche & Développement de France Télécom à Lannion,
recherche un ou deux candidats(es) pour un stage de fin d'étude
(bac+5), d'une durée de 5 mois, au sein de l'unité de recherche
"Langues Naturelles" :

SUJET 1 : Constitution de ressources linguistiques pour l'italien
SUJET 2 : Constitution de ressources linguistiques pour le néerlandais

Il s'agira de mettre au point les ressources linguistiques utilisées
par les logiciels de TALN de l'équipe sur les langues italienne et
néerlandaise :

* un lexique comportant les informations flexionnelles et
  morpho-syntaxiques,

* et une grammaire de chunking.

L'acquisition lexicale se fera semi-automatiquement (exploitation de
listes de mots et/ou de corpus) et sera validée manuellement. Elle
sera complétée par la mise au point d'un logiciel de résumé
automatique sur chacune des langues citées.

Profil : linguistique informaticien(ne), bac +5 : master professionnel
ou recherche

Langue de travail : français ou anglais
Compétences requises : italien ou néerlandais, morphologie et syntaxe,
bonne connaissance du TALN, langages de scripts, environnement unix

Durée : 5 mois (début : dès que possible)
Lieu de travail : Lannion, Côtes d'Armor, Bretagne, France
Stage indemnisé

Contacts : 
johannes(point)heinecke(at)francetelecom(point)com
estelle(point)maillebuau(at)francetelecom(point)com

-------------------------------------------------------------------------
Message diffusé par la liste Langage Naturel <LN at cines.fr>
Informations, abonnement : http://www.atala.org/article.php3?id_article=48
English version          : 
Archives                 : http://listes.cines.fr/wws/arc/ln
                           http://listserv.linguistlist.org/archives/ln.html

La liste LN est parrainée par l'ATALA (Association pour le Traitement
Automatique des Langues)
Information et adhésion  : http://www.atala.org/
-------------------------------------------------------------------------



More information about the Ln mailing list