Appel: Post-Doc, projet Kodex, IRIT, Toulouse

Thierry Hamon thierry.hamon at UNIV-PARIS13.FR
Wed Mar 17 11:24:07 UTC 2010


Date: Mon, 15 Mar 2010 18:39:09 +0100
From: Gaume Bruno <gaumeb at wanadoo.fr>
Message-ID: <4B9E70BD.2080401 at wanadoo.fr>
X-url: http://www.quaero.org



Proposition de stage de Post-doctorat pour 2010 pour une durée d'un an
renouvelable.

Dans le cadre du projet Kodex financé par le programme Quaero
http://www.quaero.org nous recherchons un chercheur post-doctorant
ayant le profil suivant :

- Nécessaire :

- Bon niveau en informatique

- Bon niveau en recherche d’information

- Compétences techniques : environnement linux, développement Java,
  Python, HTML, CSS, javascript, XML, utilisation svn.

- Les plus :

- Formation en traitement automatique des langues

- Rémunération: entre 2000^E et 3000^E net mensuel (suivant
  l’expérience depuis la thèse) ;

- Financement : projet Kodex financé par le programme Quaero ;

- Lieux du Stage : Toulouse IRIT (Institut de Recherche en
  Informatique de Toulouse) ;

- Début du stage : le plus tôt possible ;

- Durée du stage : un an à partir de la date d’embauche (renouvelable) ;

- Encadrement du stage : Bruno Gaume ;

- Contact : gaume at irit.fr <mailto:gaume at irit.fr> ;

- Contexte scientifique :

Les résultats produits par un moteur de recherche sont en deçà des
attentes de 85% des utilisateurs exploitant un moteur de recherche
lors de leurs activités quotidiennes. Les raisons évoquées sont
essentiellement l’incompréhensibilité et l’ambiguïté des informations
retournées à leurs requêtes engendrant ainsi des phénomènes fort
connus de désorientation de l‘utilisateur et de surcharge
informationnelle.

Quand un moteur de recherche reçoit une requête, cette requête est
souvent polysémique au sens ou des communautés différentes peuvent
entretenir des rapports différents avec cette requête d’où des
attentes différentes selon les intentions de l’utilisateur. Plutôt que
de mélanger la présentation des résultats des documents, concernant
ces différentes communautés, il conviendrait de faire connaître à
l’utilisateur l’existence de ces multiples points de vue sur sa
requête (mesurées par une analyse structurelle de la base documentaire
interrogée).

En s’intégrant dans une équipe pluridisciplinaire, il s’agira pour le
post-doc de développer des méthodes et de les implémenter pour
construire Kodex un moteur de recherche permettant de mieux identifier
l’information pertinente en levant les éventuelles ambiguïtés et mieux
répondre à l’incompréhensibilité des résultats de recherche. Pour cela
les résultats d’une requête seront organisés de manière thématique
sous la forme de nuages de mots, chaque nuage identifiant un ensemble
de pages thématiquement proches, ce qui permettra à l’utilisateur de
cibler sa recherche bien plus efficacement en affinant sa requête
selon les points de vue ainsi identifiés par chaque nuage de mots. Le
moteur Kodex sera évalué par la projet T.2.6 du programme Quaero sur
la plateforme OSIRIM https://osirim.irit.fr/static.php?op=quaero.html,
ce qui facilitera la mise au point et la rédaction d’articles dans le
domaine de la recherche
d’information.

-------------------------------------------------------------------------
Message diffuse par la liste Langage Naturel <LN at cines.fr>
Informations, abonnement : http://www.atala.org/article.php3?id_article=48
English version       : 
Archives                 : http://listserv.linguistlist.org/archives/ln.html
                                http://liste.cines.fr/info/ln

La liste LN est parrainee par l'ATALA (Association pour le Traitement
Automatique des Langues)
Information et adhesion  : http://www.atala.org/
-------------------------------------------------------------------------



More information about the Ln mailing list