Job: Stage Syllabs, Extraction automatique d'objets et d'attributs en domaine specialise

Thierry Hamon thierry.hamon at UNIV-PARIS13.FR
Fri Nov 18 21:54:14 UTC 2011


Date: Wed, 16 Nov 2011 18:14:37 +0100
From: Clément de Groc <cdegroc at syllabs.com>
Message-ID: <CAPPor0b3uhR-ryDSWRyefoe5cy+MyvsE=cmN9r3=NhXjGkD0dg at mail.gmail.com>


Objet : Stage recherche à Syllabs
Lieu : Syllabs, 15 rue Jean-Baptiste Berlier, 75013 Paris
Durée : 5 à 6 mois
Début du stage souhaité : entre janvier et avril 2012

Sujet du stage
Extraction automatique d'objets et d'attributs en domaine spécialisé

Mots-clés
extraction d'information, extraction d'attributs, moteur de recherche,
web

Contexte

Syllabs est spécialisée en analyse sémantique et en création automatique
de textes.
Nos technologies sont le fruit d'années de développement et maîtrisent
toutes les étapes du processus d'analyse de données textuelles du Web :
identification des pages pertinentes, crawling du Web, extraction et
catégorisation des informations clé.
Dans le cadre d'un projet de recherche, Syllabs développe des méthodes
pour construire de manière semi-automatique des moteurs de recherche
verticaux thématiques (i.e. politique, astronomie, ...) et souhaite les
enrichir de connaissances du domaine extraites (semi-) automatiquement.

Objectifs

Contrairement aux moteurs de recherche généralistes, les moteurs de
recherche thématiques sont centrés sur un domaine et peuvent tirer parti
de cette verticalité pour réaliser des analyses fines sur leurs
documents.
Nous nous intéressons, dans le cadre de ce stage, à la découverte
d'objets d'un domaine et de leurs propriétés (attributs/valeurs) à
partir d'un ensemble de documents et de connaissances minimalistes
(quelques objets+attributs du domaine).

Illustration (astronomie)
 - objets : terre, mercure, mars
 - caractéristiques : diamètre, volume, distance du soleil...

Les méthodes utilisées durant ce stage seront centrées sur le traitement
automatique des langues et l'apprentissage statistique.  La personne
recrutée travaillera au sein de l'équipe R&D.

Profil recherché
    * École d'ingénieurs avec un goût pour la recherche, Master 2
      recherche en informatique
    * Bonnes compétences en programmation : maîtrise de Python et/ou
      Java
    * Connaissances en traitement automatique des langues

Éléments facultatifs mais considérés comme un plus
    * Connaissances en recherche d'information
    * Connaissances en apprentissage statistique

Merci d'envoyer votre candidature à l'adresse
stage_extraction_objets at syllabs.com

-------------------------------------------------------------------------
Message diffuse par la liste Langage Naturel <LN at cines.fr>
Informations, abonnement : http://www.atala.org/article.php3?id_article=48
English version       : 
Archives                 : http://listserv.linguistlist.org/archives/ln.html
                                http://liste.cines.fr/info/ln

La liste LN est parrainee par l'ATALA (Association pour le Traitement
Automatique des Langues)
Information et adhesion  : http://www.atala.org/
-------------------------------------------------------------------------



More information about the Ln mailing list