Sujet de these: architecture textuelle et du discours, IRIT, Universite Paul Sabatier, Toulouse

Thierry Hamon thierry.hamon at UNIV-PARIS13.FR
Fri Mar 30 20:05:33 UTC 2012


date: Thu, 29 Mar 2012 09:12:34 +0200
from: "Mouna Kamel" <Mouna.Kamel at irit.fr>
message-id: <315e-4f740b80-d-1520b240 at 172745220>


Titre : Formalisation de l'architecture textuelle et du discours pour la
conception d’ontologies à partir de textes

Directrice de thèse : Nathalie Aussenac-Gilles Tel : 0561558293
aussenac at irit.fr
Encadrement : Mouna Kamel  Tel : 0561558338 kamel at irit.fr

Ecole Doctorale : Mathématique Informatique Télécommunications de
Toulouse
Etablissement d’inscription : Université Paul Sabatier de Toulouse – 118
Route de Narbonne – 31062  Toulouse cedex 9
Unité d'accueil : Institut de Recherche en Informatique de Toulouse –
http://www.irit.fr/
Equipe : MELODI (MEthodes et ingénierie des Langues, des Ontologies et
du Discours)
Domaine scientifique : Informatique
Mots clé : ontologie, architecture textuelle, théorie du discours,
analyse sémantique du langage, TAL
Financement : bourse ministère

Les ontologies sont des structures de représentation des connaissances
basées sur un fondement logique, qui mettent en avant les concepts d'un
domaine, les relations entre ces concepts (relations sémantiques), ainsi
que les axiomes et contraintes impliquant ces concepts et
relations. Elles contribuent grandement au développement du Web
sémantique et sont particulièrement présentes dans les domaines tels que
l’extraction d’information, l’indexation de documents, l’explicitation
d’une recherche d’information, le résumé automatique, etc.

La construction d'ontologie à partir de textes s'appuie jusqu'ici sur
des analyses statistiques et/ou des analyses linguistiques
essentiellement focalisées sur les niveaux lexicaux et
syntaxiques. Partant du constat que la mise en forme matérielle d’un
texte contribue à lui donner du sens, l’idée est d’exploiter les objets
textuels (segments de texte rendus perceptibles à la surface du texte
par leur mise en forme matérielle) porteurs de relations hiérarchiques
entre leurs différents constituants (constituants qui ne sont pas
forcément contigus dans le texte). L’objectif est donc d’élargir les
méthodes de construction d’ontologie à partir de textes en analysant les
structures discursives bénéficiant de mises en forme régulières.

La thèse a donc pour but, dans un premier temps, de formaliser certaines
structures discursives spécifiques selon une théorie du discours et un
modèle d’architecture textuelle. Il s’agira ensuite de caractériser un
ensemble d’indices syntaxico-sémantiques qui permettront tout d’abord
d’identifier automatiquement ces structures discursives, puis d’extraire
automatiquement de ces structures les connaissances ontologiques
qu’elles contiennent. Une des difficultés majeures de ce travail
consistera à identifier d’une part les concepts présents non seulement
dans les différents segments composant la structure mais aussi dans les
segments appartenant au « contexte » de la structure, et d’autre part la
nature (ontologique ou lexicale) de la ou les relations portées par la
structure. Une étude entre une approche symbolique et une approche par
apprentissage doit être envisagée. Enfin, ce travail devra permettre
d’affiner les méthodes de construction d’ontologie (DAFOE et Terminae) à
la définition desquelles contribue l’équipe MELODI.

Candidature : Les candidats intéressés devront être parmi les premiers
aux épreuves écrites de leur formation pour être sélectionnés par
l’école doctorale. Ils sont invités à envoyer une lettre de motivation,
un CV, un relevé de notes avec classement au Master le plus tôt
possible, avant le 27 avril 2012. Une seconde sélection sera ensuite
faite par l’école doctorale sur la base d’une audition début juin 2012.

pour plus d'informations : http://www.edmitt.ups-tlse.fr/

-------------------------------------------------------------------------
Message diffuse par la liste Langage Naturel <LN at cines.fr>
Informations, abonnement : http://www.atala.org/article.php3?id_article=48
English version       : 
Archives                 : http://listserv.linguistlist.org/archives/ln.html
                                http://liste.cines.fr/info/ln

La liste LN est parrainee par l'ATALA (Association pour le Traitement
Automatique des Langues)
Information et adhesion  : http://www.atala.org/
-------------------------------------------------------------------------



More information about the Ln mailing list