These: Romain Deveaud, Vers une representation du contexte thematique en Recherche d'Information

Thierry Hamon thierry.hamon at UNIV-PARIS13.FR
Fri Nov 22 21:12:42 UTC 2013


Date: Wed, 20 Nov 2013 15:48:49 +0000
From: Romain Deveaud <romain.deveaud at univ-avignon.fr>
Message-ID: <CAJ3+HoFwiWt4xU4_XwXHhrNBYygdtEf63VHiTxW-GHWHZCKQ7g at mail.gmail.com>

Bonjour,

j'ai le plaisir de vous inviter à la soutenance de ma thèse intitulée
"Vers une représentation du contexte thématique en Recherche
d'Information".  La soutenance aura lieu le vendre 29 novembre 2013 à
14h30 dans l'amphithéatre de l'IUT de l'Université d'Avignon (337,
chemin des Meinajariès 84911 Avignon, iut.univ-avignon.fr). L'IUT est
situé juste à côté du Centre d'Enseignement et de Recherche en
Informatique.  Vous êtes également conviés au pot de thèse qui suivra la
soutenance.

Bien cordialement,
Romain Deveaud


-----------------------------------------------------------------------

Le jury de soutenance sera composé de :

Mme Josiane Mothe - Professeur, IRIT, Toulouse - Présidente du jury
M. Jian-Yun Nie - Professeur, RALI, Montréal - Rapporteur
M. Philippe Mulhem - Chargé de recherche CNRS, LIG, Grenoble - Rapporteur
M. Jacques Savoy - Professeur, IIUN, Neuchâtel - Examinateur
M. Jaap Kamps - Associate professor, ILLC, Amsterdam - Examinateur
M. Benjamin Piwowarski - Chargé de recherche CNRS, LIP6, Paris - Examinateur
M. Eric SanJuan - Maître de conférences, LIA, Avignon - Co-Directeur de thèse
M. Patrice Bellot - Professeur, LSIS, Marseille - Directeur de thèse


Résumé de la thèse :
Quand des humains cherchent des informations au sein de bases de
connaissances ou de collections de documents, ils utilisent un système
de recherche d'information (SRI) faisant office d'interface.
Les utilisateurs doivent alors transmettre au SRI une représentation de
leur besoin d'information afin que celui-ci puisse chercher des
documents contenant des informations pertinentes.
De nos jours, la représentation du besoin d'information est constituée
d'un petit ensemble de mots-clés plus souvent connu sous la dénomination
de "requête".
Or, quelques mots peuvent ne pas être suffisants pour représenter
précisément et efficacement l'état cognitif complet d'un humain par
rapport à son besoin d'information initial.
Sans une certaine forme de contexte thématique complémentaire, le SRI
peut ne pas renvoyer certains documents pertinents exprimant des
concepts n'étant pas explicitement évoqués dans la requête.

Dans cette thèse, nous explorons et proposons différentes méthodes
statistiques, automatiques et non supervisées pour la représentation du
contexte thématique de la requête.
Plus spécifiquement, nous cherchons à identifier les différents concepts
implicites d'une requête formulée par un utilisateur sans qu'aucune
action de sa part ne soit nécessaire.
Nous expérimentons pour cela l'utilisation et la combinaison de
différentes sources d'information générales représentant les grands
types d'information auxquels nous sommes confrontés quotidiennement sur
internet.
Nous tirons également parti d'algorithmes de modélisation thématique
probabiliste (tels que l'allocation de Dirichlet latente) dans le cadre
d'un retour de pertinence simulé.
Nous proposons par ailleurs une méthode permettant d'estimer
conjointement le nombre de concepts implicites d'une requête ainsi que
l'ensemble de documents pseudo-pertinent le plus approprié afin de
modéliser ces concepts.  Nous évaluons nos approches en utilisant quatre
collections de test standards de TREC de grande taille.
En annexes, nous proposons également une approche de contextualisation
de messages courts exploitant des méthodes de recherche d'information et
de résumé automatique.

-------------------------------------------------------------------------
Message diffuse par la liste Langage Naturel <LN at cines.fr>
Informations, abonnement : http://www.atala.org/article.php3?id_article=48
English version       : 
Archives                 : http://listserv.linguistlist.org/archives/ln.html
                                http://liste.cines.fr/info/ln

La liste LN est parrainee par l'ATALA (Association pour le Traitement
Automatique des Langues)
Information et adhesion  : http://www.atala.org/

ATALA décline toute responsabilité concernant le contenu des
messages diffusés sur la liste LN
-------------------------------------------------------------------------



More information about the Ln mailing list