Job: Stage master recherche, Extraction de regles concernant les batiments d'un corpus textuel de plans locaux d'urbanisme, IGN

Thierry Hamon thierry.hamon at UNIV-PARIS13.FR
Mon Jan 9 09:21:55 UTC 2012


Date: Wed, 4 Jan 2012 16:01:32 +0100
From: "Domingues" <catherine.domingues at ign.fr>
Message-ID: <6AF078301E1F407A9DF23BC2E47CF661 at ign.fr>



Extraction de règles concernant les bâtiments d'un corpus de plans
locaux d'urbanisme (PLU)

Mots clés
TAL, informatique, gestion des connaissances

Contexte

Le laboratoire COGIT de l'Institut national de l'information
géographique et forestière (IGN) étudie les problématiques liées à
l'utilisation de données géographiques pour la conception de produits
(cartographies, jeux de données) ou de services répondant à des besoins
particuliers, spécifiés par les utilisateurs de ces produits.  Dans le
cadre de ses recherches, le laboratoire s'est intéressé à
l'informatisation des connaissances décrites dans les plans locaux
d'urbanisme (PLU). Les PLU sont des documents administratifs locaux
régissant le droit à bâtir pour une commune ou une communauté de
communes. Chaque PLU contient 14 articles dont la portée est fixée par
le droit de l'urbanisme. Si l'intitulé des articles est fixe (par
exemple, l'article 10 traite toujours de la hauteur maximale des
constructions), les règles qu'ils imposent sont déterminées par
l'autorité locale, cela permet alors une grande variété dans
l'expression de ces règles. Par exemple, l'article 10 peut limiter la
hauteur d'un bâtiment en mètres ou en nombre d'étages.

Actuellement, le laboratoire utilise ces connaissances dans le but de
modéliser en 3D la constructibilité des zones urbaines [Brasebin et al,
2010], [Brasebin et al, 2011]. Si actuellement, les connaissances
concernant les PLU sont saisies manuellement dans le système, ce stage
aura pour objectif de les extraire automatiquement.

Le corpus d'étude est formé de différents plans locaux d'urbanisme
correspondants à des zones différentes, cela permettra d'avoir une
variété plus importante de règles.  Nous nous intéressons
particulièrement aux règles ayant un impact sur la morphologie du
bâti. Pour l'extraction des règles, sera mis en oeuvre l'outil SEMEX,
une plateforme d'exploration sémantique et d'aide à l'acquisition de
règles métiers candidates développée à Paris 13.

Ce stage est co-encadré par les laboratoires COGIT de l'IGN et LIPN
(Laboratoire d'informatique de Paris Nord) à Villetaneuse.

Sujet

Le repérage des règles dans le corpus s'appuie sur une ontologie du
domaine. Cette ontologie n'existe pas sous forme numérique mais des
travaux préalables ont permis d'identifier les concepts pertinents et
certaines de leurs relations. Il sera nécessaire de formaliser cette
étude sous la forme d'une ontologie exploitable par Semex.  Avec l'aide
de Semex, il faudra ensuite préciser la notion de règle dans ce corpus ;
reconnaître les variations de vocabulaire autour des noms des concepts
du domaine ; repérer les indices de désambiguïsation propres à ce corpus
; définir les marqueurs spécifiques au corpus qui annoncent la
définition de règles ; repérer les transformations linguistiques qui
permettent de normaliser l'expression des règles.  Enfin, le stagiaire
devra étudier la fiabilité de l'extraction de règles à l'aide de PLU qui
n'ont pas été utilisés lors de l'analyse préalable.

Déroulement du stage

Le plan de travail pourrait être le suivant :

- étude du corpus, manuellement et à l'aide d'outils de TAL ;
- repérage des concepts et des règles du domaine sous forme d'une
  ontologie du domaine ;
- méthodologie et prise en main de Semex ;
- étudier la ré-utilisabilité du processus

Bibliographie

Brasebin M., Perret J., Haëck C., 2011, Towards a 3D geographic
information system for the exploration of urban rules: application to
the French local urban planning schemes, 28th Urban Data Management
Symposium UDMS'11, 28-30 September, Delft (Holland). Published in “Urban
and Regional Data Management : UDMS annual 2011”, Taylor and Francis, pp
37-50

Brasebin M., Perret J., Haëck C., 2010, Un système d’information
géographique 3D pour l’exploration des règles d’urbanisme, Colloque
International de Géomatique et d'Analyse Spatiale SAGEO'10, 17-19
novembre, Toulouse (France)

manuel d'utilisation de SemEx :
http://www-lipn.univ-paris13.fr/~guisse/ontorule/SemEx/SemEx_Manual.pdf
(un guide méthodologique sera disponible en février)

Compétences particulières et formation requise

Ce stage s'adresse aux étudiants de master 2 ou de 3ème année d'école d'ingénieurs
avec une spécialisation en informatique ou en traitement automatique du langage
naturel.

Lieu du stage
IGN/laboratoire COGIT
73 avenue de Paris
94165 Saint-Mandé Cedex
métro : Saint-Mandé - ligne 1
Mis en forme :
Police :Non Italique
Durée et rémunération
durée : 5 à 6 mois
début : mars/avril 2012
rémunération : 30% du SMIC
Prolongements éventuels

Le COGIT propose chaque année des sujets de thèse ainsi que des stages
de postdoctorant.

Responsables du stage
Mickaël Brasebin
IGN/SR/COGIT, 73 avenue de Paris, 94165 SAINT-MANDE Cedex
tél : 01 43 98 76 68 mél : mickael.brasebin at ign.fr

Catherine Dominguès
IGN/SR/COGIT, 73 avenue de Paris, 94165 SAINT-MANDE Cedex
tél : 01 43 98 85 44 mél : catherine.domingues at ign.fr

Le stage est co-encadré par : François Lévy
LIPN, Institut Galilée, Avenue J.B. Clément, 93430 VILLETANEUSE
tél : 01 49 40 35 78 mél : Francois.Levy at lipn.univ-paris13.fr

Pour candidater
Le dossier de candidature sera envoyé par mail. Il devra se composer
d'un curriculum vitae et d'une lettre de motivation, accompagnés des
relevés de notes des années de M1 et M2 (ou deux dernières années
d'école d'ingénieurs) et d'une description des enseignements suivis (un
lien vers le site internet de la formation est le bienvenu).


Catherine Dominguès
Laboratoire COGIT/Service de la recherche
T +33 (0)1 43 98 85 44
catherine.domingues at ign.fr
IGN - INSTITUT NATIONAL DE L'INFORMATION
GEOGRAPHIQUE ET FORESTIERE
73 AVENUE DE PARIS
94165 SAINT-MANDE CEDEX

http://recherche.ign.fr/cogit

L’INSTITUT NATIONAL DE L’INFORMATION GÉOGRAPHIQUE ET FORESTIÈRE EST NÉ
LE 1ER JANVIER 2012 DE LA FUSION DE L’INSTITUT GEOGRAPHIQUE NATIONAL ET
DE L’INVENTAIRE FORESTIER NATIONAL.

-------------------------------------------------------------------------
Message diffuse par la liste Langage Naturel <LN at cines.fr>
Informations, abonnement : http://www.atala.org/article.php3?id_article=48
English version       : 
Archives                 : http://listserv.linguistlist.org/archives/ln.html
                                http://liste.cines.fr/info/ln

La liste LN est parrainee par l'ATALA (Association pour le Traitement
Automatique des Langues)
Information et adhesion  : http://www.atala.org/
-------------------------------------------------------------------------



More information about the Ln mailing list