These: Inga Gheorghita, Construction automatique de hierarchies semantiques a partir du TLFi

Thierry Hamon hamon at LIMSI.FR
Sat Feb 8 11:27:00 UTC 2014


Date: Fri, 07 Feb 2014 23:24:56 +0100
From: Inga Gheorghita <Inga.Gheorghita at atilf.fr>
Message-ID: <assp.01151d1d13.d4ab242f18bc30d2a439bc2732d6b186 at atilf.fr>


Bonjour,

J’ai le plaisir de vous convier à ma soutenance de thèse de doctorat en
linguistique informatique intitulée :

« Construction automatique de hiérarchies sémantiques à partir du 
Trésor de la langue française informatisé (TLFi) : application à 
l'indexation et la recherche d'images ».

La thèse sera présentée et soutenue le lundi 17 février 2014 à 9h30 à
l’Université de Lorraine, Campus Lettres et Sciences Humaines et
Sociales, bâtiment CNRS-ATILF, salle Imbs.

La soutenance sera suivie du traditionnel pot de thèse auquel vous êtes
tous chaleureusement invités.

=======================
   Composition du jury :
=======================

Béatrice DAILLE, Professeur à l’Université de Nantes (rapporteur)
Brigitte GRAU, Professeur à l’ENSIIE (rapporteur)
Cyril MARCH, Ingénieur, Directeur général de Xilopix (invité)
Jean-Marie PIERREL, Professeur à l’Université de Lorraine (directeur de
thèse)
Alain POLGUÈRE, Professeur à l’Université de Lorraine (examinateur)
Yannick TOUSSAINT, Chargé de Recherche HDR à l’INRIA  (examinateur)

==========
   Résumé :
==========

L’objectif principal de cette thèse est de montrer que les informations
lexicales issues d’un dictionnaire de langue, tel le Trésor de la langue
française informatisé (TLFi), peuvent améliorer les processus
d’indexation et de recherche d’images. Le problème d’utilisation d’une
telle ressource est qu’elle n’est pas suffisamment formalisée pour être
exploitée d’emblée dans un tel domaine d’application.  Pour résoudre ce
problème, nous proposons, dans un premier temps, une approche de
construction automatique de hiérarchies sémantiques à partir du TLFi.
Après avoir défini une caractéristique quantitative (mesurable) et
comparable des noms apparaissant dans les définitions lexicographiques,
à travers une formule de pondération permettant de sélectionner le nom
de poids maximal comme l’hyperonyme pour un lexème donné du TLFi, nous
proposons un algorithme de construction automatique de hiérarchies
sémantiques pour les lexèmes des vocables du TLFi.  Une fois notre
approche validée à travers des évaluations manuelles, nous montrons,
dans un second temps, que les hiérarchies sémantiques obtenues à partir
du TLFi peuvent être utilisées pour l’enrichissement d’un thésaurus
construit manuellement ainsi que pour l’indexation automatique d’images
à partir de leurs descriptions textuelles associées. Nous prouvons aussi
que l’exploitation d’une telle ressource dans le domaine de recherche
d’images améliore la précision de la recherche en structurant les
résultats selon les domaines auxquels les concepts de la requête de
recherche peuvent faire référence. La mise en place d’un prototype nous
a permis ainsi d’évaluer et de valider les approches ainsi proposées.

==========
Mots-clés :
==========

hiérarchies sémantiques, ressources lexicales, pondération, 
dictionnaire de langue, TLFi, indexation et recherche d’images, 
thésaurus


Au plaisir de vous retrouver,
Inga Gheorghita

-------------------------------------------------------------------------
Message diffuse par la liste Langage Naturel <LN at cines.fr>
Informations, abonnement : http://www.atala.org/article.php3?id_article=48
English version       : 
Archives                 : http://listserv.linguistlist.org/archives/ln.html
                                http://liste.cines.fr/info/ln

La liste LN est parrainee par l'ATALA (Association pour le Traitement
Automatique des Langues)
Information et adhesion  : http://www.atala.org/

ATALA décline toute responsabilité concernant le contenu des
messages diffusés sur la liste LN
-------------------------------------------------------------------------



More information about the Ln mailing list