Sujet de These: Apport des modeles stochastiques de langage pour la recherche d'informations pertinentes sur le web, LORIA, Nancy

Thierry Hamon thierry.hamon at LIPN.UNIV-PARIS13.FR
Mon Aug 28 09:13:34 UTC 2006


Date: Fri, 25 Aug 2006 19:14:28 +0200
From: Armelle Brun <Armelle.Brun at loria.fr>
Message-ID: <44EF2FF4.7040804 at loria.fr>




TITRE : Apport des modèles stochastiques de langage au filtrage collaboratif


CONTEXTE :

Le principe du filtrage collaboratif [2] est de prédire dans un
ensemble de ressources disponibles celles qui sont susceptibles
d'intéresser un internaute à partir de son historique de consultation
et du comportement connu d'une population d'utilisateurs.

Actuellement, les algorithmes de filtrage collaboratif [3] n'intègrent
pas la notion de séquence d'observations et ne sont pas capables de
traiter des problèmes du type « c'est parce que j'ai lu A puis B que
je vais aimer C ».

Les modèles statistiques comme les modèles n-grams (modèles de Markov
d'ordre n) [1] utilisés en modélisation statistique du langage
constituent une approche prometteuse au vu du problème considéré. En
effet, en reconnaissance de la parole, ces modèles permettent de
prédire le mot qui va être prononcé sachant le début de la phrase
(historique des mots prononcés). Plus précisément, ils fournissent des
probabilités d'apparition de mots. Supposons par exemple que le début
de phrase « le petit chat boit du » soit prononcé. Le modèle
statistique du langage évaluera la probabilité des futurs mots pouvant
suivre ce début de phrase, par exemple le mot « lait » dont la
probabilité sera forte. La suite de mots pourra être assimilée à la
suite chronologique des documents lus (A puis B) et ainsi nous
pourrons prédire de façon plus performante l'intérêt du document C.

Cette approche est novatrice et se situe à l'intersection de deux
domaines de recherche représentés dans deux équipes du laboratoire :
Parole (Modélisation statistique du langage) et Maia (filtrage
collaboratif).

Dans le cadre de la thèse qui se déroulera au sein de l'équipe MAIA,
nous proposons d'étudier l'apport des techniques de modélisation
statistique du langage au filtrage collaboratif et de proposer de
nouveaux modèles de recommandation de ressources prenant en compte la
notion d'historique de consultation.


La thèse sera co-financée : 50% par la région - 50% sur un contrat de
recherche

BIBLIOGRAPHIE :

[1] Brun -  Détection de thème et adaptation des modèles de langage pour 
la reconnaissance automatique de la parole. 2003

[2] Castagnos  Vers un système de filtrage collaborative distribué: le 
modèle RSB

[3] Miller PocketLens : Toward a personal recommender system

CONTACTS :

·Anne Boyer, Equipe Maia - boyer at loria.fr
·Armelle Brun, Equipe Parole - brun at loria.fr


Les candidatures, qui devront nous parvenir par e-mail, avant le 15
septembre 2006, devront comporter un CV et une lettre de motivation
Elles seront adressées à : boyer at loria.fr, brun at loria.fr


--
Armelle BRUN
Maitre de conférences
Laboratoire LORIA - Equipe PAROLE
tel : 03 83 59 30 64



-------------------------------------------------------------------------
Message diffuse par la liste Langage Naturel <LN at cines.fr>
Informations, abonnement : http://www.atala.org/article.php3?id_article=48
English version       : 
Archives                 : http://listserv.linguistlist.org/archives/ln.html
                                http://liste.cines.fr/info/ln

La liste LN est parrainee par l'ATALA (Association pour le Traitement
Automatique des Langues)
Information et adhesion  : http://www.atala.org/
-------------------------------------------------------------------------



More information about the Ln mailing list