[ln] Job: Stage pour etudiant(e) en TAL, KOLTECH, Paris
Thierry Hamon
thierry.hamon at LIPN.UNIV-PARIS13.FR
Tue Jan 25 12:03:54 UTC 2005
Date: Mon, 24 Jan 2005 16:15:27 +0100
From: "Fabienne Gire" <fabienne.gire at koltech-group.com>
Message-ID: <00a401c50227$8bd85d80$4700000a at Kureishi>
X-url: http://www.koltech-group.com
X-url: http://www.temis-group.com
********************************************************************
Bonjour,
KOLTECH recherche un stagiaire de profil "linguiste informaticien"
pour une durée de 4 mois minimum (voir ci-dessous la description du
stage).
Les candidats peuvent envoyer CV, lettre de motivation (en PJ), durée
du stage et dates de disponibilité à l'adresse
recrutement at koltech-group.com en spécifiant "LGQ05 - STAGE 2005 -
Linguiste informaticien" dans l'Objet.
Cordialement,
Fabienne GIRE
Responsable linguistique KOLTECH
Tour Gamma B
193-197 rue de Bercy
75582 PARIS Cedex 12
FRANCE
fabienne.gire at koltech-group.com
http://www.koltech-group.com
tel: +33 1 40 04 46 95
fax: +33 1 40 04 46 80
Stage "linguiste informaticien" 2005 - Ref LGQ05
Intitulé du stage
Développement du volet anglophone du logiciel CV Distiller (extraction
d'information des CV écrits en anglais par des candidats Européens)
INFORMATIONS SUR L'ENTREPRISE
Raison sociale et coordonnées
KOLTECH SAS
Tour Gamma B
193-197 rue de Bercy
75012 PARIS
Nom et fonction du responsable technique qui encadrera le stagiaire :
Fabienne GIRE, Responsable linguistique
Date de début de stage : Mars 2005 (selon disponibilités du candidat)
Durée : 4 mois minimum
Indemnité mensuelle de stage envisagée : 0 à < 30 % SMIC, conditionnée
par les compétences et l'efficacité du stagiaire ET l'obtention d'un
crédit de projet pour le développement du logiciel
Définition technique du stage
Objectif
Création des cartouches de connaissances pour l'extraction et la
normalisation d'information à partir de CV rédigés en anglais par des
citoyens Européens.
Contexte
KOLTECH est une société d'édition de solutions Ressources Humaines
basée à Paris (http://www.koltech-group.com/).
Elle développe notamment le logiciel CV Distiller, un outil d'analyse
automatique de CV qui intègre la technologie de Text Mining de TEMIS
(http://www.temis-group.com).
KOLTECH étend actuellement son logiciel à la gestion des CV écrits en
anglais par des citoyens Européens. Pour cela, des cartouches de
connaissance (Skill Cartridges - composants de connaissance pour le
serveur d'extraction d'information : lexiques et règles
morpho-syntaxiques) devront être créées ou enrichies.
Déroulement du stage :
A. Formation
1.. Formation aux outils TEMIS pour l'extraction d'information
2.. Formation aux cartouches de connaissances de TEMIS.
3.. Formation au logiciel CV Distiller
B. Travail sur les cartouches
4.. Etablissement de corpus de développement et de test.
5.. Recherche d'informations utilisables par la cartouche et l'
application.
6.. Ecriture des cartouches de connaissances : lexiques et règles.
7.. Création de bases de connaissance permettant l'interfaçage entre
la couche linguistique et le système expert
C. Qualité
8.. Participation au développement de jeux de référence permettant de
mesurer la qualité du logiciel
9.. Test des résultats des cartouches créées avec le logiciel CV Distiller
Outils de génie linguistique utilisés pendant le stage :
- extracteur d'information de TEMIS.
- étiqueteur morpho-syntaxique XeLDA.
- outil pour l'écriture des règles de chez TEMIS
Langage(s) de programmation :
Langage des cartouches de connaissance
Perl et XML/XSL éventuellement
PROFIL DU CANDIDAT
Le candidat devra impérativement être anglophone et issu d'une formation
comportant du TAL.
Compétences nécessaires :
- connaissances en syntaxe formelle
- connaissances des expressions régulières
- connaissances d'outils pour formater un texte (emacs, textpad,
commandes unix ou perl)
- parfaite maîtrise de la langue anglaise (si possible avoir déjà vécu
au Royaume-Uni), connaissance d'une ou plusieurs autres langues
européennes (autres que le français)
- la connaissance des différents systèmes éducatifs et culturels
Européens serait un plus.
-------------------------------------------------------------------------
Message diffusé par la liste Langage Naturel <LN at cines.fr>
Informations, abonnement : http://www.biomath.jussieu.fr/LN/LN-F/
English version : http://www.biomath.jussieu.fr/LN/LN/
Archives : http://listserv.linguistlist.org/archives/ln.html
La liste LN est parrainée par l'ATALA (Association pour le Traitement
Automatique des Langues)
Information et adhésion : http://www.atala.org/
-------------------------------------------------------------------------
More information about the Ln
mailing list