Sujet de these: Recherche d'Information et TAL, Toulouse, France

Thierry Hamon thierry.hamon at UNIV-PARIS13.FR
Sat Jul 10 20:08:34 UTC 2010


Date: Fri, 9 Jul 2010 16:44:34 +0200
From: Ludovic.Tanguy at univ-tlse2.fr
Message-ID: <19511.13778.979941.75648 at erss-tanguy2.i-univ-tlse2.fr>
X-url: http://www.irit.fr/SIG_EVI/fr/GroupeEVI.htm
X-url: http://w3.erss.univ-tlse2.fr/axe5


Financement de thèse en Recherche d'Information et TAL
Lieu : Toulouse, France
Début : Octobre 2010
Durée : 3 ans

Titre : Variabilité en recherche d'information - Etude des
caractéristiques linguistiques influençant les résultats.


Directeurs : Josiane Mothe, Pr. (IRIT, Informatique) - Ludovic Tanguy,
MCF (CLLE, Sciences du langage)


Des études récentes en recherche d'information (RI) ont montré
d'importantes variations de performance entre des systèmes (le système
A donnant de bons résultats pour une requête, et de mauvais pour une
autre, le système B réagissant à l'opposé). Cette variabilité est
complexe car liée à plusieurs facteurs : la formulation des requêtes,
les liens entre requêtes et documents, les caractéristiques du système
utilisé. Cette thèse vise l'étude des contextes dans lequel un système
de RI est utilisé, et comment il peut être adapté. Une attention
particulière sera portée aux caractéristiques linguistiques des
requêtes et des documents.

Le sujet de recherche est interdisciplinaire et se situe à la jonction
de l'informatique (RI) et du traitement automatique des langues (TAL).

Le travail est prévu pour se dérouler suivant ces étapes :

- Collecte de données. Un ensemble de collections de documents et de
  requêtes ont déjà été identifiée et obtenues (logs de moteurs de
  recherche Web, collections d'évaluation), mais devra être étendu.

- Analyse des requêtes et des documents : description et
  caractérisation des données, à travers la définition de variables
  descriptives. Ces variables devront être calculables automatiquement
  en utilisant des outils de TAL.

- Fouille de données : classification et analyse statistique des
  données annotées. Corrélation de ces caractéristiques avec les
  performances des systèmes de RI.

- Proposition d'un système adaptatif : établissement de procédures
  permettant d'adapter le traitement (modules de RI) en fonction des
  critères pertinents identifiés.


Profil du candidat:

Le candidat doit être titulaire d'un Master en informatique ou en
traitement automatique des langues. Il doit avoir des connaissances
approfondies en recherche d'information (modèles et
applications). Anglais et Français courant.

Contexte :

Cette thèse interdisciplinaire sera partagée entre deux laboratoires
de l'université de Toulouse : IRIT (Institut de Rercherche en
Informatique de Toulouse, UMR 5505) équipe SIG (Systèmes d'Information
Généralisés) et CLLE-ERSS (Cognition Langues Langage Ergonomie -
Equipe de Recherche en Syntaxe et Sémantique, UMR 5263) axe TAL
(Traitement Automatique des Langues).

Sites Web:
http://www.irit.fr/SIG_EVI/fr/GroupeEVI.htm
http://w3.erss.univ-tlse2.fr/axe5

Candidature :

Envoyer un CV (avec le détail des cours et notes de Master), une
lettre de candidature, ainsi qu'une lettre de recommandation ou les
coordonnées d'au moins un référent universitaire aux adresses
suivantes :

mothe at irit.fr
tanguy at univ-tlse2.fr

-------------------------------------------------------------------------
Message diffuse par la liste Langage Naturel <LN at cines.fr>
Informations, abonnement : http://www.atala.org/article.php3?id_article=48
English version       : 
Archives                 : http://listserv.linguistlist.org/archives/ln.html
                                http://liste.cines.fr/info/ln

La liste LN est parrainee par l'ATALA (Association pour le Traitement
Automatique des Langues)
Information et adhesion  : http://www.atala.org/
-------------------------------------------------------------------------



More information about the Ln mailing list