Job: Stage Syllabs, Extraction automatique d'objets et d'attributs en domaine specialise
Thierry Hamon
thierry.hamon at UNIV-PARIS13.FR
Fri Nov 18 21:54:14 UTC 2011
Date: Wed, 16 Nov 2011 18:14:37 +0100
From: Clément de Groc <cdegroc at syllabs.com>
Message-ID: <CAPPor0b3uhR-ryDSWRyefoe5cy+MyvsE=cmN9r3=NhXjGkD0dg at mail.gmail.com>
Objet : Stage recherche à Syllabs
Lieu : Syllabs, 15 rue Jean-Baptiste Berlier, 75013 Paris
Durée : 5 à 6 mois
Début du stage souhaité : entre janvier et avril 2012
Sujet du stage
Extraction automatique d'objets et d'attributs en domaine spécialisé
Mots-clés
extraction d'information, extraction d'attributs, moteur de recherche,
web
Contexte
Syllabs est spécialisée en analyse sémantique et en création automatique
de textes.
Nos technologies sont le fruit d'années de développement et maîtrisent
toutes les étapes du processus d'analyse de données textuelles du Web :
identification des pages pertinentes, crawling du Web, extraction et
catégorisation des informations clé.
Dans le cadre d'un projet de recherche, Syllabs développe des méthodes
pour construire de manière semi-automatique des moteurs de recherche
verticaux thématiques (i.e. politique, astronomie, ...) et souhaite les
enrichir de connaissances du domaine extraites (semi-) automatiquement.
Objectifs
Contrairement aux moteurs de recherche généralistes, les moteurs de
recherche thématiques sont centrés sur un domaine et peuvent tirer parti
de cette verticalité pour réaliser des analyses fines sur leurs
documents.
Nous nous intéressons, dans le cadre de ce stage, à la découverte
d'objets d'un domaine et de leurs propriétés (attributs/valeurs) à
partir d'un ensemble de documents et de connaissances minimalistes
(quelques objets+attributs du domaine).
Illustration (astronomie)
- objets : terre, mercure, mars
- caractéristiques : diamètre, volume, distance du soleil...
Les méthodes utilisées durant ce stage seront centrées sur le traitement
automatique des langues et l'apprentissage statistique. La personne
recrutée travaillera au sein de l'équipe R&D.
Profil recherché
* École d'ingénieurs avec un goût pour la recherche, Master 2
recherche en informatique
* Bonnes compétences en programmation : maîtrise de Python et/ou
Java
* Connaissances en traitement automatique des langues
Éléments facultatifs mais considérés comme un plus
* Connaissances en recherche d'information
* Connaissances en apprentissage statistique
Merci d'envoyer votre candidature à l'adresse
stage_extraction_objets at syllabs.com
-------------------------------------------------------------------------
Message diffuse par la liste Langage Naturel <LN at cines.fr>
Informations, abonnement : http://www.atala.org/article.php3?id_article=48
English version :
Archives : http://listserv.linguistlist.org/archives/ln.html
http://liste.cines.fr/info/ln
La liste LN est parrainee par l'ATALA (Association pour le Traitement
Automatique des Langues)
Information et adhesion : http://www.atala.org/
-------------------------------------------------------------------------
More information about the Ln
mailing list