Job: Stage en linguistique informatique, Syllabs
Thierry Hamon
thierry.hamon at UNIV-PARIS13.FR
Fri Dec 11 21:24:22 UTC 2009
Date: Fri, 11 Dec 2009 16:12:41 +0100
From: "Helena Blancafort" <blancafort at syllabs.com>
Message-ID: <011b01ca7a74$6249a8f0$26dcfad0$@com>
STAGE EN LINGUISTIQUE INFORMATIQUE
Contexte
********
Outil d’aide aux linguistes (OAL) pour le développement de ressources
linguistiques multilingues & Linguistic Object Language (LOL) pour
l’écriture des grammaires pour l’extraction d’information.
L’un des aspects clés des applications en Traitement Automatique des
Langues est lié à la qualité de ressources linguistiques sur
lesquelles celles-ci s’appuient. A priori les ressources sont toujours
perfectibles, mais son enrichissement et raffinement est un processus
coûteux et parfois assez fastidieux pour les linguistes. Le but d’OAL
est justement de rendre cette tâche plus productive et surtout, de
faciliter le contrôle de la qualité (test de régression, gestion des
questions liées aux ressources multilingues). Sujet du stage
1) Développement des lexiques morphosyntaxiques SylLex et des lexiques
SylThème dans OAL, outil d’aide aux linguistes conçu pour le
développement de ressources linguistiques ainsi que définition et
participation à la mise en place des ressources et procédures
nécessaires pour l’alimentation semi-automatique de l’outil.
2) Écriture des règles d’extraction d’information dans un
environnement multilingue.
Langues possibles
******************
allemand, danois, chinois, néerlandais, polonais, portugais, russe,
suédois ou tchèque.
Objectifs du stage
******************
La personne recrutée pour ce stage aura deux tâches principales :
1) Le développement et l’intégration des lexiques morphosyntaxiques et
thématiques de Syllabs dans une des langues listées en haut dans OAL,
notre outil d’aide aux linguistes conçu pour le développement de
ressources linguistiques. La phase de développement des lexiques
implique la création des ressources et procédures semi-automatiques
nécessaires pour alimenter le lexique tout en assurant leur qualité
(création de corpus, définition des critères linguistiques pour le
crawling conditionnel, définition du jeux d’étiquettes
morphosyntaxiques suivant les conventions du formalisme SylLex,
définition des tests de régression, évaluation quantitative et
qualitative des lexiques, évaluation de la couverture).
2) L’écriture des grammaires pour l’extraction d’information avec LOL,
un langage de programmation linguistique développé à Syllabs.
Connaissances souhaitées
************************
Étudiant(e) en Linguistique Informatique, Traitement Automatique des
Langues.
Très bonne maîtrise de la morphologie.
Très bonne maîtrise de PERL ou Python et Unix.
Expérience avec Intex ou Nooj serait un plus.
Merci d’envoyer votre candidature à l’adresse suivante : jobs
/arrobas/ syllabs .com tout en indiquant dans l’objet du mèl « stage
en linguistique informatique ».
-------------------------------------------------------------------------
Message diffuse par la liste Langage Naturel <LN at cines.fr>
Informations, abonnement : http://www.atala.org/article.php3?id_article=48
English version :
Archives : http://listserv.linguistlist.org/archives/ln.html
http://liste.cines.fr/info/ln
La liste LN est parrainee par l'ATALA (Association pour le Traitement
Automatique des Langues)
Information et adhesion : http://www.atala.org/
-------------------------------------------------------------------------
More information about the Ln
mailing list