Stage: stage M2 en TAL, Syllabs (Paris)

Thierry Hamon thierry.hamon at UNIV-PARIS13.FR
Tue Nov 5 20:57:29 UTC 2013


Date: Tue, 5 Nov 2013 12:38:59 +0100
From: Helena Blancafort <blancafort at syllabs.com>
Message-ID: <CAMRVM+0TzuWr+8LTTC0qcN=O1sg-Jb4dxsMshPcnDoS6qb=C6w at mail.gmail.com>


------------------------------------------------------------------------
 Offre de stage M2 en TAL à Syllabs (Paris)
------------------------------------------------------------------------

------------------------------------------------------------------------
Caractérisation des objets touristiques pour l'extraction de facettes
dans le tourisme
------------------------------------------------------------------------

Syllabs travaille depuis un certain temps sur des outils de TAL
appliqués au tourisme, que ce soit dans un contexte de web mining, de
text mining ou de production de contenus.Dans le cadre de Tourinflux,
projet de recherche multi-partenaire en cours, Syllabs doit produire des
bases de connaissances se rapportant à des objets touristiques (hôtels,
etc.). Ce projet vise à apporter aux acteurs du tourisme (d’abord les
institutionnels mais aussi les acteurs privés) un ensemble d’outils leur
permettant de gérer à la fois leurs données internes et les informations
disponibles sur le web afin de mieux comprendre comment un territoire
est perçu et de mieux agir sur cette perception. C’est dans ce contexte
que se situe le stage. Celui-ci comporte plusieurs étapes et
objectifs. La durée du stage ne permettra peut-être pas de tout couvrir.

----------------------------
 Descriptif du stage
----------------------------

1) Modélisation d’une base de connaissances des objets touristiques

- Créer une taxonomie (simple) des différents objets touristiques et
  étudier les facettes communes à plusieurs objets.

- Déterminer les facettes utilisables pour la génération automatique des
  descriptifs

- Déterminer les facettes nécessaires pour l’analyse d’avis
  d’internautes

2) Extraction des facettes via LOL (outil dédié à base de règles
   linguistiques)

- Extraction des facettes présents dans les “descriptifs marchands”

- Extraction des facettes présents dans les “avis internautes”

3) Création de la base à partir de la sortie d’extraction

- Créer une base de données à partir de la sortie d’extraction,
  manipulation des objets extraits

4) Génération de descriptifs d’objets touristiques

- écrire des règles de génération pour 2 objets touristiques différents
  en fonction de la base obtenue

------------------------
  Profil souhaité
------------------------

- Aptitude pour la représentation formelle du langage.

- Excellente capacité de communication et aptitude pour le travail
  d’équipe.

- Bon niveau en python serait un plus.

- Excellentes qualités rédactionnelles, goût pour l’écriture.


Formation en cours : Linguistique Informatique, TAL ou similaire.

Durée du stage : 6 mois (début entre janvier et avril, en fonction du
cursus universitaire)

Merci d’envoyer votre candidature à l’adresse jobs at syllabs.com en
indiquant dans l’objet du mél « Stage TAL ».

Lieu : Syllabs, 26 rue Notre Dame de Nazareth, 75003 Paris.

Contrat : stage conventionné rémunéré en fonction du niveau d’étude.

-------------------------------------------------------------------------
Message diffuse par la liste Langage Naturel <LN at cines.fr>
Informations, abonnement : http://www.atala.org/article.php3?id_article=48
English version       : 
Archives                 : http://listserv.linguistlist.org/archives/ln.html
                                http://liste.cines.fr/info/ln

La liste LN est parrainee par l'ATALA (Association pour le Traitement
Automatique des Langues)
Information et adhesion  : http://www.atala.org/

ATALA décline toute responsabilité concernant le contenu des
messages diffusés sur la liste LN
-------------------------------------------------------------------------



More information about the Ln mailing list