Job: Stage M2, Exploitation de relations semantiques pour la Recherche d'Information
Thierry Hamon
thierry.hamon at UNIV-PARIS13.FR
Wed Feb 6 09:23:05 UTC 2013
Date: Mon, 04 Feb 2013 22:57:18 +0100
From: Haifa.Zargayouna at lipn.univ-paris13.fr
Message-ID: <880802789a557634ece06f44fc0efd8b at lipn.univ-paris13.fr>
-----------
Titre du stage M2 : Exploitation de relations sémantiques pour la
Recherche d'Information
Descriptif et contexte
La recherche d'information sémantique (RIS) a pour but de dépasser les
limites d'une recherche classique par mots-clés. Les méthodes de RIS
visent à s'affranchir de ces limites via le passage à un niveau
conceptuel par le biais d'une ressource sémantique. L'exploitation des
ressources sémantiques se limite généralement au niveau des concepts où
les mots-clés sont substitués par les concepts et où le raisonnement se
fait essentiellement sur les liens hiérarchiques entre ces concepts. Ces
méthodes ne permettent pas de prendre en compte toute la richesse des
ressources sémantiques qui ne sont considérées que comme des structures
taxonomiques.
Le stage vise à enrichir un modèle de recherche d'information sémantique
pour prendre en compte les relations sémantiques entre concepts afin
d'améliorer la qualité des documents retournés. De nombreux travaux dans
le cadre du Web Sémantique ont montré l'utilité des relations
sémantiques (i.e rôles) pour améliorer l'accès à l'information [1]. Les
rôles permettent d'appliquer des moteurs d'inférences et de répondre à
des requêtes complexes qui nécessitent du raisonnement [2]. Plusieurs
pistes sont possibles, comme l'intégration de mesures de proximité
sémantique (e.g. [2]), ou exploitation des relations sémantiques pour
ré-ordonnancer les résultats.
Le stage se déroulera au LIPN (http ://www-lipn.univ-paris13.fr/),
Université Paris 13 dans l'équipe «Représentation des Connaissances et
Langage Naturel» (RCLN). Ce stage est rémunéré grâce au soutien du
laboratoire d'excellence "Empirical Foundations of Linguistics" (labex
EFL, http://www.labex-efl.org/). Il fait partie d'un projet plus large
visant à étudier la contribution de sources de connaissances pour
l'extraction d'information, mené en commun entre le LIPN et le LATTICE
dans le cadre du labex EFL.
Missions
Les différentes étapes du travail à réaliser sont les suivantes :
* État de l'art
* Propositions de différents scénarios
* Intégration des propositions dans une plate-forme existante (YaSemIR
ou TerrierSIR développées au LIPN)
* Mise en place d'une évaluation
* Analyse des résultats
Références
[1] Claudia d'Amato‚ Nicola Fanizzi‚ Bettina Fazzinga‚ Georg Gottlob and
Thomas Lukasiewicz. (2012) «Ontology−based semantic search on the Web
and its combination with the power of inductive reasoning» In Annals of
Mathematics and Artificial Intelligence. Vol. 65. No. 2/3. Pages 83−121.
[2] Uren, V., Sabou, M., Motta, E., Fernandez, M., Lopez, V., Lei, Y.
(2011) «Reflections on five years of evaluating semantic search
systems». In International Journal of Metadata, Semantics and
Ontologies, 5(2), p.87-98.
[3] G. Hirst et D. St-Onge. (1998) «Lexical chains as representations of
context for the detection and correction of malapropisms.» In WordNet :
An electronic lexical database. MIT Press. Pages 305-332.
Profil recherché
- De niveau Master2
- Autonome en informatique : connaissance d’UNIX, de Java
- Intérêt pour le web sémantique et la recherche d'information
- La connaissance de Lucene ou Terrier est un plus
Durée : 6 mois
Début souhaité : avril 2013
Modalité de dépôt de candidature
Merci d'envoyer un CV détaillant la formation et l'expérience acquise,
les bulletins de notes ainsi qu'une lettre de motivation à :
Haïfa Zargayouna (haifa.zargayouna at lipn.univ-paris13.fr)
Davide Buscaldi (davide.buscaldi at lipn.univ-paris13.fr)
-------------------------------------------------------------------------
Message diffuse par la liste Langage Naturel <LN at cines.fr>
Informations, abonnement : http://www.atala.org/article.php3?id_article=48
English version :
Archives : http://listserv.linguistlist.org/archives/ln.html
http://liste.cines.fr/info/ln
La liste LN est parrainee par l'ATALA (Association pour le Traitement
Automatique des Langues)
Information et adhesion : http://www.atala.org/
-------------------------------------------------------------------------
More information about the Ln
mailing list