Sujet de these: Recherche d'Information et TAL, Toulouse, France
Thierry Hamon
thierry.hamon at UNIV-PARIS13.FR
Sat Jul 10 20:08:34 UTC 2010
Date: Fri, 9 Jul 2010 16:44:34 +0200
From: Ludovic.Tanguy at univ-tlse2.fr
Message-ID: <19511.13778.979941.75648 at erss-tanguy2.i-univ-tlse2.fr>
X-url: http://www.irit.fr/SIG_EVI/fr/GroupeEVI.htm
X-url: http://w3.erss.univ-tlse2.fr/axe5
Financement de thèse en Recherche d'Information et TAL
Lieu : Toulouse, France
Début : Octobre 2010
Durée : 3 ans
Titre : Variabilité en recherche d'information - Etude des
caractéristiques linguistiques influençant les résultats.
Directeurs : Josiane Mothe, Pr. (IRIT, Informatique) - Ludovic Tanguy,
MCF (CLLE, Sciences du langage)
Des études récentes en recherche d'information (RI) ont montré
d'importantes variations de performance entre des systèmes (le système
A donnant de bons résultats pour une requête, et de mauvais pour une
autre, le système B réagissant à l'opposé). Cette variabilité est
complexe car liée à plusieurs facteurs : la formulation des requêtes,
les liens entre requêtes et documents, les caractéristiques du système
utilisé. Cette thèse vise l'étude des contextes dans lequel un système
de RI est utilisé, et comment il peut être adapté. Une attention
particulière sera portée aux caractéristiques linguistiques des
requêtes et des documents.
Le sujet de recherche est interdisciplinaire et se situe à la jonction
de l'informatique (RI) et du traitement automatique des langues (TAL).
Le travail est prévu pour se dérouler suivant ces étapes :
- Collecte de données. Un ensemble de collections de documents et de
requêtes ont déjà été identifiée et obtenues (logs de moteurs de
recherche Web, collections d'évaluation), mais devra être étendu.
- Analyse des requêtes et des documents : description et
caractérisation des données, à travers la définition de variables
descriptives. Ces variables devront être calculables automatiquement
en utilisant des outils de TAL.
- Fouille de données : classification et analyse statistique des
données annotées. Corrélation de ces caractéristiques avec les
performances des systèmes de RI.
- Proposition d'un système adaptatif : établissement de procédures
permettant d'adapter le traitement (modules de RI) en fonction des
critères pertinents identifiés.
Profil du candidat:
Le candidat doit être titulaire d'un Master en informatique ou en
traitement automatique des langues. Il doit avoir des connaissances
approfondies en recherche d'information (modèles et
applications). Anglais et Français courant.
Contexte :
Cette thèse interdisciplinaire sera partagée entre deux laboratoires
de l'université de Toulouse : IRIT (Institut de Rercherche en
Informatique de Toulouse, UMR 5505) équipe SIG (Systèmes d'Information
Généralisés) et CLLE-ERSS (Cognition Langues Langage Ergonomie -
Equipe de Recherche en Syntaxe et Sémantique, UMR 5263) axe TAL
(Traitement Automatique des Langues).
Sites Web:
http://www.irit.fr/SIG_EVI/fr/GroupeEVI.htm
http://w3.erss.univ-tlse2.fr/axe5
Candidature :
Envoyer un CV (avec le détail des cours et notes de Master), une
lettre de candidature, ainsi qu'une lettre de recommandation ou les
coordonnées d'au moins un référent universitaire aux adresses
suivantes :
mothe at irit.fr
tanguy at univ-tlse2.fr
-------------------------------------------------------------------------
Message diffuse par la liste Langage Naturel <LN at cines.fr>
Informations, abonnement : http://www.atala.org/article.php3?id_article=48
English version :
Archives : http://listserv.linguistlist.org/archives/ln.html
http://liste.cines.fr/info/ln
La liste LN est parrainee par l'ATALA (Association pour le Traitement
Automatique des Langues)
Information et adhesion : http://www.atala.org/
-------------------------------------------------------------------------
More information about the Ln
mailing list