Job: Sujet de stage CEA LIST - LVIC, Construction et mise a jour de dictionnaires multilingues
Thierry Hamon
thierry.hamon at UNIV-PARIS13.FR
Fri Jan 13 21:30:04 UTC 2012
Date: Thu, 12 Jan 2012 14:02:16 +0000
From: SEMMAR Nasredine 202247 <nasredine.semmar at cea.fr>
Message-ID: <50CC12289F0C854FBFF134F270030CD7013D1108 at EXDAG0-B2.intra.cea.fr>
Stage Bac+5 : Alignement de mots à partir de corpus de textes parallèles
pour la construction et la mise à jour de dictionnaires multilingues
Lieu du stage : CEA Saclay Nano-INNOV, Laboratoire Vision et Ingénierie
des Contenus (LVIC), 91 191 Gif sur Yvette
Sujet :
Les dictionnaires bilingues constituent les principaux composants des
systèmes de traduction automatique et de recherche d'information
interlingue. La masse de travail nécessaire pour créer manuellement les
dictionnaires bilingues est importante. C'est la raison pour laquelle
depuis quelques années de nombreuses approches de construction
automatique de ces dictionnaires ont été proposées.
L'objectif de ce stage sera, d'une part, de constituer un corpus de
référence de textes parallèles multilingues, et d'autre part, d'évaluer
les principaux composants du module de construction et de mise à jour de
dictionnaires bilingues développé au Laboratoire Vision et Ingénierie
des Contenus du CEA LIST.
Ce stage comportera les étapes suivantes:
- Appropriation des principaux composants du module de construction et
de mise à jour de dictionnaires bilingues.
- Constitution d'un corpus de référence composé de textes parallèles
multilingues.
- Mise en place d'outils d'évaluation du module d'alignement de mots
simples et complexes.
- Spécification et implémentation d'un module de nettoyage des
dictionnaires bilingues construits ou mis à jour automatiquement.
Profil recherché :
Bac+5, stage de fin d'étude dans le domaine du Traitement Automatique de
la Langue (TAL).
Compétences en informatique et en TAL
Programmation : C++, Perl ou équivalent
Langues : Maîtrise de l'anglais et du français, la connaissance de la
langue arabe est un plus
Contact et envoi des candidatures :
Nasredine SEMMAR, 01 69 08 01 46, nasredine.semmar at cea.fr
Durée : 4 à 6 mois
Nasredine SEMMAR
CEA Saclay Nano-INNOV
Institut CARNOT CEA LIST
Laboratoire Vision et Ingénierie des Contenus (LVIC)
Point courrier n°173
91 191 Gif sur Yvette CEDEX
Tel: +33 (0)1 69 08 01 46
Fax: +33 (0)1 69 08 01 15
Email: nasredine.semmar at cea.fr
-------------------------------------------------------------------------
Message diffuse par la liste Langage Naturel <LN at cines.fr>
Informations, abonnement : http://www.atala.org/article.php3?id_article=48
English version :
Archives : http://listserv.linguistlist.org/archives/ln.html
http://liste.cines.fr/info/ln
La liste LN est parrainee par l'ATALA (Association pour le Traitement
Automatique des Langues)
Information et adhesion : http://www.atala.org/
-------------------------------------------------------------------------
More information about the Ln
mailing list