These: Apport des modeles stochastiques de langage pour la recherche d'informations pertinentes sur le web, fin 15 sep

Wed Sep 6 10:09:10 UTC 2006

  From: Armelle Brun 

TITRE : Apport des modèles stochastiques de langage au filtrage 
collaboratif

CONTEXTE :

Le principe du filtrage collaboratif [2] est de prédire dans un
ensemble de ressources disponibles celles qui sont susceptibles
d'intéresser un internaute à partir de son historique de consultation
et du comportement connu d'une population d'utilisateurs.

Actuellement, les algorithmes de filtrage collaboratif [3] n'intègrent
pas la notion de séquence d'observations et ne sont pas capables de
traiter des problèmes du type « c'est parce que j'ai lu A puis B que
je vais aimer C ».

Les modèles statistiques comme les modèles n-grams (modèles de Markov
d'ordre n) [1] utilisés en modélisation statistique du langage
constituent une approche prometteuse au vu du problème considéré. En
effet, en reconnaissance de la parole, ces modèles permettent de
prédire le mot qui va être prononcé sachant le début de la phrase
(historique des mots prononcés). Plus précisément, ils fournissent des
probabilités d'apparition de mots. Supposons par exemple que le début
de phrase « le petit chat boit du » soit prononcé. Le modèle
statistique du langage évaluera la probabilité des futurs mots pouvant
suivre ce début de phrase, par exemple le mot « lait » dont la
probabilité sera forte. La suite de mots pourra être assimilée à la
suite chronologique des documents lus (A puis B) et ainsi nous
pourrons prédire de façon plus performante l'intérêt du document C.

Cette approche est novatrice et se situe à l'intersection de deux
domaines de recherche représentés dans deux équipes du laboratoire :
Parole (Modélisation statistique du langage) et Maia (filtrage
collaboratif).

Dans le cadre de la thèse qui se déroulera au sein de l'équipe MAIA,
nous proposons d'étudier l'apport des techniques de modélisation
statistique du langage au filtrage collaboratif et de proposer de
nouveaux modèles de recommandation de ressources prenant en compte la
notion d'historique de consultation.

La thèse sera co-financée : 50% par la région - 50% sur un contrat de
recherche

BIBLIOGRAPHIE :

[1] Brun - Détection de thème et adaptation des modèles de langage pour
la reconnaissance automatique de la parole. 2003

[2] Castagnos Vers un système de filtrage collaborative distribué: le
modèle RSB

[3] Miller PocketLens : Toward a personal recommender system

CONTACTS :

·Anne Boyer, Equipe Maia - boyer at loria.fr
·Armelle Brun, Equipe Parole - brun at loria.fr

Les candidatures, qui devront nous parvenir par e-mail, avant le 15
septembre 2006, devront comporter un CV et une lettre de motivation
Elles seront adressées à : boyer at loria.fr, brun at loria.fr

--
Armelle BRUN
Maitre de conférences
Laboratoire LORIA - Equipe PAROLE
tel : 03 83 59 30 64

------------------------------------------------------------------------ 
-
Message diffuse par la liste Langage Naturel 
Informations, abonnement : 
http://www.atala.org/article.php3?id_article=48
English version :
Archives : 
http://listserv.linguistlist.org/archives/ln.html
http://liste.cines.fr/info/ln

La liste LN est parrainee par l'ATALA (Association pour le Traitement
Automatique des Langues)
Information et adhesion : http://www.atala.org/
------------------------------------------------------------------------ 
-

-------
Message redirigé par le relais d'information sur les sciences de la 
cognition (RISC) sans virus
http://www.risc.cnrs.fr 

---------------------------------
 Découvrez un nouveau moyen de poser toutes vos questions quelque soit le sujet ! Yahoo! Questions/Réponses pour partager vos connaissances, vos opinions et vos expériences. Cliquez ici. 
-------------- next part --------------
An HTML attachment was scrubbed...
URL: <http://listserv.linguistlist.org/pipermail/parislinguists/attachments/20060906/1953451e/attachment.htm>