Job: Postdoc Categorisation automatique de grands volumees de donnees textuelles, FT R&D, Lannion

Thierry Hamon thierry.hamon at LIPN.UNIV-PARIS13.FR
Fri Jul 13 15:58:26 UTC 2007


Date: Wed, 11 Jul 2007 18:40:26 +0200
From: "LASSALLE Edmond RD-TECH-LAN" <edmond.lassalle at orange-ftgroup.com>
Message-ID: <2CAE5634D52E194BA393187E0568E1AC025D1A5B at ftrdmel1.rd.francetelecom.fr>


Le laboratoire de recherche TECH/EASY de France Télécom R&D recherche
un postdoc pour une durée de 12 mois sur les méthodes de
catégorisation sémantique de très grands volumes de données textuelles
en français pour diverses applications industrielles et de recherche.

Le candidat devra travailler sur la problématique de catégorisation
automatique dans un cadre appliqué. Cela inclut les objectifs suivants:

* Etat de l'art sur les approches vectorielles probabilistes
  (Probabilistic Latent Semantic ou Latent Dirichlet Allocation ou Non
  Negative Matrix Factorization)

* Points plus spécifiques à aborder :

* Mise en oeuvre d'une méthode de catégorisation automatique de
  documents en exploitant des sous-ensembles de vocabulaire
  pré-catégorisés et un réseau sémantique stochastisé a couverture
  générale.

* Structuration du réseau sémantique à couverture générale en
  sous-réseaux sémantiques interconnectés, chaque sous-réseau étant
  associé à un domaine sémantique.

Profil souhaité :

* Doctorat en informatique avec de bonnes connaissances en
  apprentissage/acquisition automatiques de connaissances à partir de
  corpus textuels

* Bonnes connaissances des modèles de Markov et/ou des approches PLSA,
  LDA ou NMF

* Expérience significative dans la manipulation de données

* Connaissances en Java ou C ou OCaml

* Maîtrise de l'environnement Linux

* Motivation à travailler en équipe

Le poste est basé dans les locaux de France Télécom à Lannion (Côtes
d'Armor, Bretagne, France)

Les candidatures sont à envoyer à : 
Edmond Lassalle
  edmond.lassalle(at)orange-ftgroup.com,


-------------------------------------------------------------------------
Message diffuse par la liste Langage Naturel <LN at cines.fr>
Informations, abonnement : http://www.atala.org/article.php3?id_article=48
English version       : 
Archives                 : http://listserv.linguistlist.org/archives/ln.html
                                http://liste.cines.fr/info/ln

La liste LN est parrainee par l'ATALA (Association pour le Traitement
Automatique des Langues)
Information et adhesion  : http://www.atala.org/
-------------------------------------------------------------------------



More information about the Ln mailing list