Job: Stage eleve ingenieur ou master 2, Nice

Thierry Hamon thierry.hamon at UNIV-PARIS13.FR
Fri Feb 12 20:21:06 UTC 2010


Date: Wed, 10 Feb 2010 18:08:01 +0100
From: Jacques Farré <Jacques.Farre at unice.fr>
Message-ID: <4B72E7F1.20803 at unice.fr>


Lieu : Sophia Antipolis et Nice
Durée : 4 à 6 mois

L'équipe Ressources Linguistiques du Laboratoire I3S (Université de
Nice) propose le stage (rémunéré) ci-dessous.

Si vous êtes intéressé(e), merci d'envoyer un CV à
Jacques.Farre at unice.fr

*Titre : traitement linguistique de requêtes dans des moteurs de
recherche*


*Sujet :* Le bon classement d'une page web dans l'ensemble des pages
répondant à une requête à un moteur de recherche dépend de la
pertinence des mots-clés présents dans cette page. Une étude
statistique des requêtes permet de définir les mots-clés les plus
intéressants.  Cependant des requêtes analogues peuvent se présenter
sous différentes formes, par exemple :

	Je cherche un appartement en location sur nice
	cherche location appartement Nice
	cherche location appartement sur nice
	cherch location  appartament Nice (avec fautes d'orthographes)

génèrent des jeux de données statistiques différents.
Un traitement de ces requêtes appliquant des technologies du
traitement automatique des langues naturelles (TALN) permettrait de
corriger les fautes d'orthographes des requêtes, de les épurer de
leurs mots fonctionnels (prépositions, articles,...)  trop généraux et
donc non porteurs de sens, et éventuellement de les normaliser, par
exemple :

   (action:location; quoi:appartement;lieu:Nice-06).

Cela permettrait alors de « fusionner » différentes requêtes telle que
celles données ci-dessus et d'améliorer ainsi les statistiques
générées.

Le stage consistera à se familiariser avec une chaîne d'analyse du
français et ses ressources linguistiques (lexiques, grammaires ...)
puis à l'adapter pour obtenir une forme aussi normalisée que possible
des requêtes. Il comprendra des visites à une PME niçoise spécialisée
dans le référencement commercial sur le web.

-------------------------------------------------------------------------
Message diffuse par la liste Langage Naturel <LN at cines.fr>
Informations, abonnement : http://www.atala.org/article.php3?id_article=48
English version       : 
Archives                 : http://listserv.linguistlist.org/archives/ln.html
                                http://liste.cines.fr/info/ln

La liste LN est parrainee par l'ATALA (Association pour le Traitement
Automatique des Langues)
Information et adhesion  : http://www.atala.org/
-------------------------------------------------------------------------



More information about the Ln mailing list