Stage: Parametrage et evaluation d'un systeme de classification automatique de rapports de securite, Toulouse
Thierry Hamon
hamon at LIMSI.FR
Fri Feb 14 20:49:03 UTC 2014
Date: Wed, 12 Feb 2014 16:03:13 +0100
From: Ludovic Tanguy <tanguy at univ-tlse2.fr>
Message-ID: <52FB8D31.4090104 at univ-tlse2.fr>
Stage de Master 2 / Ecole d'ingénieur : paramétrage et évaluation d'un
système de classification automatique de rapports de sécurité.
L'entreprise :
CFH (Conseil en facteurs humains)/SafetyDATA est une PME spécialisée
dans le traitement automatique des langues dans le domaine de la
sécurité. Elle travaille en collaboration avec CLLE-ERSS, un laboratoire
de linguistique, et plus particulièrement avec l'équipe TAL (Traitement
automatique des langues). Le stage sera co-encadré par CFH et le
laboratoire CLLE.
Contexte :
CFH a conçu un système de traitement automatique des langues dont le but
est d'analyser des rapports d'incidents afin de proposer une ou
plusieurs catégorie(s) pour leur indexation dans une base de données. Le
système est actuellement déployé et analyse chaque mois plusieurs
centaines de documents (en français et en anglais) à l'aide de règles
apprises automatiquement et basées sur le repérage de certains termes
dans les rapports analysés. Voir plus de détails sur
http://www.safety-data-analysis.com/
Le stage vise l'évolution de ce système de classification, notamment en
envisageant l'utilisation d'un système d'apprentissage supervisé
statistique. L'objectif de ce stage est double :
1/ Identifier et quantifier le gain apporté par l'utilisation d'un
modèle statistique (SVM, régression logistique, réseau bayésien,
etc.) par rapport au système actuel ;
2/ Mesurer l'impact sur les performances du système des différents
traitements linguistiques appliqués aux documents avant leur analyse
(correction des erreurs, normalisation des formes de surface,
identification d'expressions complexes, utilisation de classes
sémantiques, etc.).
Profil recherché :
Étudiant en deuxième année de master ou dernière année d'école
d'ingénieur, en informatique ou traitement automatique des langues.
Compétences requises :
Systèmes de classification automatique par apprentissage
artificiel. L'étudiant doit connaître le fonctionnement de ces systèmes
et être autonome quant à leur utilisation et évaluation (scripts,
gestion de données volumineuses, etc.)
On attend également de l'étudiant une capacité à observer les données et
à s'intégrer dans un environnement interdisciplinaire.
Détails :
- stage conventionné et rémunéré basé à Toulouse
- durée : 4 à 6 mois à partir de mars
Contact :
Céline Raynal raynal at conseil-fh.fr
Ludovic Tanguy tanguy at univ-tlse2.fr
-------------------------------------------------------------------------
Message diffuse par la liste Langage Naturel <LN at cines.fr>
Informations, abonnement : http://www.atala.org/article.php3?id_article=48
English version :
Archives : http://listserv.linguistlist.org/archives/ln.html
http://liste.cines.fr/info/ln
La liste LN est parrainee par l'ATALA (Association pour le Traitement
Automatique des Langues)
Information et adhesion : http://www.atala.org/
ATALA décline toute responsabilité concernant le contenu des
messages diffusés sur la liste LN
-------------------------------------------------------------------------
More information about the Ln
mailing list