Sujet de these: Modele documentaire pour le web semantique juridique

Sun Nov 28 18:29:36 UTC 2010

Date: Wed, 24 Nov 2010 16:13:30 +0100
From: Sylvie Salotti <Sylvie.Salotti at lipn.univ-paris13.fr>
Message-ID: <fb5ac5f3e92b10f208c69f8512360729 at mail.lipn.univ-paris13.fr>
X-url: http://www.metalex.eu/

Proposition de thèse financée

Lieu : LIPN, Paris 13
Début : Décembre 2010 ou janvier 2011
Durée : 3 ans

Titre : Modèle documentaire pour le web sémantique juridique

Contexte :
Cette thèse est financée dans le cadre du projet Legilocal dans lequel
le LIPN collabore notamment avec le laboratoire CERSA et la société
LexisNexis France. Un objectif important du projet est de proposer aux
collectivités locales des solutions s'appuyant sur les technologies du
web sémantique pour simplifier l'accès des citoyens aux données
publiques et juridiques locales.

Sujet :
Dans le domaine juridique, les documents contiennent de nombreuses
références à d'autres documents (citation, correction, jurisprudence,
etc...). Ces liens de différentes natures sont une information riche,
souvent indispensable pour une bonne interprétation du
document. L'objectif de la thèse est de proposer un modèle
documentaire permettant de représenter à la fois un contenu sémantique
des documents mais aussi la sémantique de leurs liens
intertertextuels, et de définir des méthodes d'exploitation de ce
modèle pour la recherche d'information et/ou la navigation dans les
documents.

La thèse pourra s'appuyer sur les travaux de recherche d'information
sémantique, qui proposent des approches pour modéliser et exploiter la
sémantique des documents afin de permettre des recherches dans une
collection documentaire spécialisée plus fines et plus pertinentes
qu'une recherche par mots-clés . Ces méthodes s'appuient en général
sur des ressources sémantiques du domaine d'application (ontologies,
thésaurus,...), qui sont utilisées pour annoter les documents.
Certaines de ces approches permettent également de modéliser et
d'exploiter la structure des documents. En revanche ces travaux ne
permettent pas en général de modéliser et d'exploiter la structure de
la collection documentaire, c'est-à-dire les liens entre les
documents.

Dans un premier temps, il s'agira de définir un modèle documentaire
enrichi permettant de représenter à la fois des annotations
sémantiques issues d'un ensemble de ressources sémantiques, et des
liens intertextuels de différentes natures (citation, correction,
liens temporels...) entre les documents.  Pour cette étape, il faudra
étudier les documents collectés dans le projet Legilocal et les
standards déjà existants pour la modélisation de documents juridiques
(Ex: CEN Metalex, http://www.metalex.eu/) et, à partir de là, définir
une sémantique documentaire et un modèle de documents adaptés aux
sources et aux besoins des utilisateurs tels qu'ils auront été
identifiés par les partenaires du projet Legilocal.

Dans un second temps, il faudra concevoir des méthodes d'accès aux
contenus des documents permettant d'exploiter cette structure
documentaire sémantique. Enfin, il faudra implémenter ce modèle sur la
collection documentaire du projet Legilocal, et l'exploiter et le
tester dans les tâches définies par le projet.

Lieu  : Equipe Représentation des Connaissances et Langage Naturel 
au LIPN (http://www-lipn.univ-paris13.fr/)
Encadrement : Sylvie Salotti et Adeline Nazarenko

Profil recherché : Master en informatique ou linguistique
informatique, compétences en Ingénierie des Connaissances et/ou
Traitement Automatique des Langues

Envoyer CV, lettre de motivation et notes de master à : 
sylvie.salotti at lipn.univ-paris13.fr

Références
[1] H. Zargayouna, S. Salotti. "Mesure de similarité dans une
ontologie pour l'indexation sémantique de documents XML", in Actes de
la conférence Ingénierie des Connaissances, IC'2004.

[2] A. Nazarenko, "Sur quelle sémantique reposent les méthodes
automatiques d'accès au contenu textuel ?", in Sémantique et corpus
(A. Condamines éd.), Lavoisier, Paris, pp 211-244, 2005

[3]T. Mondary, A. Bouffier, A. Nazarenko, "Between browsing and
search, a new model for navigating through large documents", in
Proceedings of the european cognitive science conference
(EuroCogSci07), pp 634-639, May 2007, Delphi, Greece

[4] F. Lévy, A. Nazarenko, A. Guissé, Annotation, indexation et
parcours de documents numériques, in Document Numérique, n° spécial
"Le texte, objet d'analyse et vecteur de connaissance", à paraître.

-------------------------------------------------------------------------
Message diffuse par la liste Langage Naturel <LN at cines.fr>
Informations, abonnement : http://www.atala.org/article.php3?id_article=48
English version       : 
Archives                 : http://listserv.linguistlist.org/archives/ln.html
                                http://liste.cines.fr/info/ln

La liste LN est parrainee par l'ATALA (Association pour le Traitement
Automatique des Langues)
Information et adhesion  : http://www.atala.org/
-------------------------------------------------------------------------