These: Nouha OMRANE, Methode de construction d'un reseau termino-conceptuel normalise
Thierry Hamon
thierry.hamon at UNIV-PARIS13.FR
Wed Sep 25 16:09:16 UTC 2013
Date: Tue, 24 Sep 2013 11:23:07 +0200
From: Nouha Omrane <nouha.omrane at lipn.univ-paris13.fr>
Message-ID: <CANvu-gFeKe1X4=hpVVCPqTkbitmzOLKVSHNvA3wBKuzaMGrm1Q at mail.gmail.com>
X-url: http://www-lipn.univ-paris13.fr/~omrane/
Bonjour,
C'est avec plaisir que je vous fais part de la soutenance de ma thèse,
intitulée :
"Méthode de construction d'un réseau termino-conceptuel normalisé :
contribution à la construction d'ontologies à partir de textes"
La soutenance se déroulera le lundi 30 septembre, à 14h.30, à
l'Université Paris 13, 99 av. J.B Clément 93430 Villetaneuse, salle B107
du LIPN (voir : http://lipn.univ-paris13.fr/fr/contact ). Elle sera
suivie d'un pot auquel vous êtes bien sûr chaleureusement conviés.
Composition du Jury :
Jean Charlet, Chargé de mission Recherche AP-HP, INSERM (Rapporteur)
Marie-Claude L'Homme, Professeur, Université de Montréal (Rapporteur)
Adeline Nazarenko, Professeur, Université Paris 13 (Directrice)
Sylvie Szulman, Maître de conférences, Université Paris 13 (Co-Encadrante)
Nathalie Aussenac-Gilles, Directrice de Recherche CNRS, IRIT (Examinatrice)
Patrick Albert, Leader IBM CAS France (Examinateur)
Aldo Gangemi, Professeur, Université Paris 13 (Examinateur)
Résumé :
La construction d'ontologies de domaine à partir de textes repose sur
des techniques de traitement automatique de la langue (TAL) couplées à
des techniques d'ingénierie de connaissances pour aboutir à un modèle
formel décrivant les connaissances partagées dans un domaine
précis. L'un des enjeux du passage des textes à des ontologies est
l'identification du vocabulaire du domaine et sa structuration sous la
forme d'un thesaurus avant sa formalisation. Ce sont les difficultés
inhérentes à cette exploitation du matériau linguistique et à sa
normalisation qui ont retenu notre attention dans ce travail de thèse.
Nous proposons une méthode de normalisation qui permet de transformer le
matériau linguistique -- tel qu'il a été extrait d'un corpus
d'acquisition par des outils de TAL -- en un réseau sémantique que nous
appelons "réseau termino-conceptuel" et qui décrit le vocabulaire
normalisé du domaine, c'est-à-dire le vocabulaire filtré, désambiguïsé
et structuré. Ce vocabulaire normalisé peut être utilisé tel que (c'est
une forme de thesaurus) ou comme point de départ pour la formalisation
en ontologie.
Cette thèse a été conduite dans le cadre du projet européen ONTORULE
(ONTOlogy meets business RULEs). Notre approche s'inscrit dans le cadre
global d'une méthode de construction de ressources ontologiques à partir
de textes, TERMINAE, qui s'appuie sur une approche terminologique et qui
propose de médiatiser le passage du terme au concept par un niveau
termino-conceptuel.
Cette thèse a permis d'affiner cette méthode en montrant comment
structurer les différents niveaux de connaissances (les niveaux
terminologique, termino-conceptuel et conceptuel), décomposer le travail
de normalisation en différentes opérations, enchaîner ces opérations et
contrôler le processus global de normalisation. Cette méthode de
normalisation permet de guider le travail de l'ingénieur de la
connaissance qui se retrouve, à l'issue de la phase d'analyse des corpus
d'acquisition, face à une masse importante d'unités linguistiques à
traiter, dont certaines sont ambiguës et qui ne sont pas toutes
pertinentes pour le domaine.
Pour élaborer cette méthode de normalisation, cette thèse a mis l'accent
sur :
- l'enrichissement du réseau terminologique par la prise en compte
notamment des entités nommées là où les approches terminologiques
exploitaient essentiellement les termes;
- la formalisation des structures de connaissances manipulées dans le
processus de construction d'ontologies : nous avons défini précisément
les formalismes à utiliser pour modéliser chaque niveau de
connaissances et mis en évidence les liens de correspondance qui
permettent de dériver un modèle à partir d'un autre mais aussi
d'articuler les connaissances ontologiques et terminologiques;
- la définition précise des opérations de normalisation qui manipulent
les structures de connaissances ci-dessus et amènent à construire un
réseau termino-conceptuel à partir d'un réseau terminologique;
l'ensemble de ces opérations forme une méthode de normalisation qui
permet de guider l'ingénieur de la connaissance dans la détection du
vocabulaire du domaine et dans ses choix de normalisation; des
indicateurs permettent de suivre la progression du travail de
normalisation.
Mots clés :
Normalisation terminologique, Construction d'ontologies à partir de
textes, Potentiel terminologique, Entités nommées.
Bien cordialement.
Nouha OMRANE
Doctorante au Laboratoire d'Informatique de Paris Nord (LIPN), equipe RCLN
http://www-lipn.univ-paris13.fr/~omrane/
UMR 7030 CNRS
Institut de Galilée
99 av JB Clément
93430 Villetaneuse
-------------------------------------------------------------------------
Message diffuse par la liste Langage Naturel <LN at cines.fr>
Informations, abonnement : http://www.atala.org/article.php3?id_article=48
English version :
Archives : http://listserv.linguistlist.org/archives/ln.html
http://liste.cines.fr/info/ln
La liste LN est parrainee par l'ATALA (Association pour le Traitement
Automatique des Langues)
Information et adhesion : http://www.atala.org/
ATALA décline toute responsabilité concernant le contenu des
messages diffusés sur la liste LN
-------------------------------------------------------------------------
More information about the Ln
mailing list