Job: Post Doc, Analyse de donnees en contexte, Projet Tourinflux, Universite de La Rochelle

Thierry Hamon thierry.hamon at UNIV-PARIS13.FR
Wed Oct 2 16:02:18 UTC 2013


Date: Wed, 2 Oct 2013 15:47:52 +0200
From: Alain Couillault <alain.couillault at univ-lr.fr>
Message-ID: <CAMN5EuahP=Zr+DHjXWF0jhYXPb9fPVR0nS6fNT7H09d915_9JA at mail.gmail.com>


Poste de Post‐Doctorat

Selection de caractéristiques pour l’analyse de données en contexte

Le laboratoire L3i, EA 2118, dans le cadre du projet Tourinflux, lance
un appel à candidatures pour un poste de post-doctorant en informatique
dans le domaine de l’analyse d’évènement touristiques
spatio-temporelles.

*Durée :* 12 mois (une extension de 12 mois est envisageable)

*Date d’embauche :* 1er novembre 2013

*Salaire :* 2100 € net / mois

*Lieu de travail :* dans les locaux du L3i à La Rochelle

*Spécialité :* Informatique

*Mots-clés :* Analyse de données, Evènements spatiaux temporels,
inférence, Modélisation d’occurrence temporelle, Semantic Web,
Ingénierie des connaissances, Logiques de Description, E-tourisme,
Normalisation (TimeML, TourInFrance)

Description du projet et du poste :

Les travaux menés par le candidat se dérouleront au sein du L3i et
s’inscriront dans le projet Tourinflux. Le laboratoire L3i, EA 2118 créé
en 1993, représente la seule et unique composante de recherche du
domaine STIC sur l’Université de la Rochelle associant très efficacement
les chercheurs de l’IUT de la Rochelle, et du Pôle Sciences en
informatique. Dans le cadre de la politique quadriennale (désormais
quinquennale) de l’université de la Rochelle, le L3i vient d’être évalué
A par l’AERES.

Le laboratoire Informatique, Image et Interaction a choisi d’axer son
projet de laboratoire autour de deux thèmes (Axes Thématiques) que sont
« Image, Document et Données Complexes » et « Systèmes Interactifs et
Images », véritables cœurs de métier du laboratoire. Par ailleurs, le
laboratoire propose de mettre en avant ASPIC (Axe Stratégique Pertinence
Intraction/Contenus), vecteur de visibilité de son action scientifique
au sein de projets structurants et en articulation avec le monde
socio-économique. Ainsi, plus d’une dizaine de projets sont actuellement
menés autour de l’analyse de documents et de données complexes d’une
part (en lien avec le centre européen de valorisation des contenus
numériques – Valconum), et autour de l’interaction appliquée aux jeux
vidéos et l’e-Education d’autre part.

De part ses activités de ces six dernières années, le L3i a développé
des outils et des compétences dans l’analyse de données récurrentes dans
le temps et l’espace, mais également l’analyse de contenus et de données
complexes et hétérogènes.

Le projet Tourinflux, sélectionnée dans le cadre de l’appel à projets
Big Data du Fonds National pour la Société Numérique et financé dans le
programme d’investissements d’avenir, rassemble deux entreprises, une
association d’entreprises et le laboratoire L3i, et sera réalisé en
partenariat avec plusieurs acteurs du tourisme de France. Ce projet vise
à apporter aux acteurs du tourisme (d’abord les institutionnels mais
aussi les acteurs privés) un ensemble d’outils leur permettant de gérer
à la fois leurs données internes et les informations disponibles sur le
web afin de mieux comprendre comment un territoire est perçu et de mieux
agir sur cette perception.

Les outils actuellement à disposition des institutionnels du tourisme
sont insuffisants pour répondre à ce besoin du fait des problèmes de
collecte, d’analyse, de manipulation et d’échange d’informations
réalisés de manière beaucoup trop artisanale.
L’objectif de Tourinflux est de proposer un tableau de bord complet
permettant aux institutionnels du tourisme, quelle que soit leur taille,
de visualiser et interpréter l’information disponible par rapport à leur
territoire (aux niveaux micro et macro) afin de prendre les décisions
les plus efficaces.

Plus spécifiquement, le candidat retenu travaillera sur l’analyse
d’objets touristiques (hôtels, festivals, etc) afin de déterminer des
caractéristiques minimales de ces objets pour des profils
d’utilisateurs.  L’objectif de ce travail sera de mettre un place une
stratégie de *recherche d’information* adaptée aux besoins des
*professionnels du tourisme*.  L’efficacité d’une telle approche repose
sur une *structuration sémantique*de l’ *information touristique* :

1) Structuration sémantique et semi-automatique de l’information
   touristique.

   Les informations touristiques sont des informations à la fois
   hétérogènes (textes libres, pages web, photos, …) et
   semi-structurées. La structuration de l’information est un défi
   majeur à l’heure où la masse d’information non structurée est en
   évolution constante, que ce soit sur le web où dans les
   organisations. Les processus classiques de structuration de
   l’information sont des processus manuels ou semi-automatique,
   fortement dépendant du domaine et de sa sémantique.

   Le premier objectif de ce travail sera de mettre en place un
   processus semi-automatique de structuration de l’information
   touristique. Deux verrous scientifiques ont été identifiés :

   - Adapter les techniques de traitement automatique de la langue au
     vocabulaire spécifique de l’information touristique pour extraire
     les termes caractéristiques du domaine

   - Modéliser la sémantique du domaine qui s'organise naturellement
     sous une forme hiérarchique (thesaurus ou ontologie)



2) Recherche d’information adaptée aux besoins des professionnels du
   tourisme

   Dans un processus classique de recherche d'information par requête,
   l'utilisateur peut affiner sa recherche en modifiant sa requête
   initiale.  D'autres stratégies proposent à l'utilisateur une
   recherche d’information par navigation dans une structuration a
   priori des données (arborescence de fichiers, liens html, ….). Il
   existe des mécanismes de recherche d'information dit « par facettes
   », à la fois par requête et par navigation, permettant à
   l'utilisateur d'exprimer une requête, puis de l'affiner par
   navigation. De tels mécanismes favorisent le raffinement des
   requêtes, et nous semblent particulièrement adaptés aux
   professionnels du tourisme pour une recherche rapide et efficace.

   Le second objectif de ce travail sera double :

   - Déterminer les caractéristiques minimales de chaque objet
     touristique pour un accès plus rapide à l’information. Deux
     approches sont envisageables : une approche statistique, et une
     approche logique.

   - Mettre en place un prototype de recherche d’information par
     facettes adaptée aux besoins des professionnels du tourisme.

Qualifications

Les candidats au poste devront être titulaires d’un doctorat en
informatique, avec des compétences en représentation des connaissances
et fouille de données. Une expérience de recherche dans au moins deux
des quatre domaines suivants est également demandée :

- Traitement Automatique des Langues, Fouille de texte

- Connaissances en BigData et entrepôts de données (Hadoop, autre)

- Modélisation, Ontologie et moteur d’inférence

- Annotation et évaluation

- Ecriture de grammaires d’extraction**

- Maitriser un ou plusieurs langages de programmation (Python, C/C++,
java, ...)

Postuler

Les candidats au poste devront envoyer un CV, un énoncé des intérêts de
recherche, et les noms et coordonnées d’au moins trois références
(adresses mail comprises) à : mickael.coustaty at univ-lr.fr ;
jean-marc.ogier at univ-lr.fr

-------------------------------------------------------------------------
Message diffuse par la liste Langage Naturel <LN at cines.fr>
Informations, abonnement : http://www.atala.org/article.php3?id_article=48
English version       : 
Archives                 : http://listserv.linguistlist.org/archives/ln.html
                                http://liste.cines.fr/info/ln

La liste LN est parrainee par l'ATALA (Association pour le Traitement
Automatique des Langues)
Information et adhesion  : http://www.atala.org/

ATALA décline toute responsabilité concernant le contenu des
messages diffusés sur la liste LN
-------------------------------------------------------------------------



More information about the Ln mailing list