Job: Stage, categorisation automatique de documents entrants, BNP Parisbas

Thierry Hamon thierry.hamon at UNIV-PARIS13.FR
Fri Jul 3 20:26:58 UTC 2009


Date: Fri, 3 Jul 2009 09:56:00 +0200
From: michel.bernardini at bnpparibas.com
Message-ID: <OFEF1654D6.6CF4D810-ONC12575E8.00277FB7-C12575E8.002B94AC at bnpparibas.com>

Bonjour,

Nous recherchons un stagiaire pour une mission de six mois (rémunérée)
pour travailler sur notre application.

Cette mission consistera à travailler pour un portail d'informations
économiques et financières interne "LEOnard" qui compte près de 9000
abonnés et environ 1000 connexions par jour.

 Destiné à l'ensemble des collaborateurs du groupe, ce portail allie
recherche d'informations et push (présentation d'informations)
toujours plus pointues et pertinentes.

Ces informations proviennent de base de données internes, de sites web
et de près de 400 articles issus de la presse quotidienne économique.
Plusieurs technologies sont utilisés dans LEOnard : Polyspot (moteur
de recherche), KB Crawl et KB Platform (outil de surveillance, de
collecte et de diffussion d'informations provenant du web) et Temis
(text mining).

Dans le cadre du développement de ce portail, nous recherchons un(e)
stagiaire pour poursuivre un travail entamé de catégorisation
automatique de tous nouveaux documents entrants (sectorielles --> ex:
constructeurs automobiles, pétrole, banques ...).
Un corpus de documents provenant de notre centre de Documentation 
économique a été utilisé comme documents référents (masters).

Nous souhaitons également mettre en place une technique dit de "grains
de similarité" permettant de proposer suite à une recherche ou
affichage d'un article un ou plusieurs documents autres similaires

Pour ce faire, nous nous sommes équipés des logiciels de Temis
(entreprise, leader dans le domaine du text mining).

Nous recherchons donc un stagiaire de niveau master (1ère ou 2ème
année) pour travailler sur ces logiciels et nous apporter ses
compétences dans l'utilisation et les perspectives que nous pouvons
tirer de ces technologies.

- Tests et analyse de l'outil de Text-mining Temis (extraction
  d'entités nommées, concepts économiques, catégorisations
  automatisées,..)

- Suivi du déploiement de la mise à disposition de ce moteur de
  recherche entreprise (outil en langage naturel) auprès des
  utilisateurs, mise à jour guide utilisateur.

- Participation aux démonstrations en interne et à l’externe.

- ...etc

Compétences requises : 

- Etre méthodique, autonome, rigoureux et curieux. 

- Prendre des initiatives, partager ses idées et son savoir-faire et
  donc savoir travailler en équipe

- Anglais lu parlé obligatoire 

- Notions informatiques type langage html, xml, structuration et
  développement de sites internet "


Cordialement
Michel Bernardini


Michel Bernardini
BNP PARIBAS
Etudes Economiques
6 Bld Capucines
ACI : CIK01A1
75450 paris cedex 09
tel : 01.42.98.05.71 / 06.64.01.64.07
fax : 01.42.98.19.92


-------------------------------------------------------------------------
Message diffuse par la liste Langage Naturel <LN at cines.fr>
Informations, abonnement : http://www.atala.org/article.php3?id_article=48
English version       : 
Archives                 : http://listserv.linguistlist.org/archives/ln.html
                                http://liste.cines.fr/info/ln

La liste LN est parrainee par l'ATALA (Association pour le Traitement
Automatique des Langues)
Information et adhesion  : http://www.atala.org/
-------------------------------------------------------------------------



More information about the Ln mailing list