Sujet de these: Ingenierie des connaissances et TAL

Thierry Hamon thierry.hamon at UNIV-PARIS13.FR
Sat Mar 17 21:15:37 UTC 2012


Date: Wed, 14 Mar 2012 10:38:42 +0100
From: Nathalie Aussenac-Gilles <aussenac at irit.fr>
Message-ID: <4F606722.2070702 at irit.fr>

**

**

*Formalisation de l'architecture textuelle et du discours *

*pour la conception d’ontologies à partir de textes*

Responsable : Nathalie Aussenac-Gilles 
Tel : 0561558293 aussenac at irit.fr

Encadrement : Mouna Kamel  
Tel : 0561558338 kamel at irit.fr

*Ecole Doctorale* : Mathématique Informatique Télécommunications de
 Toulouse

*Etablissement d’inscription* : Université Paul Sabatier de Toulouse –
118 Route de Narbonne – 31062Toulouse cedex 9

*Unité d'accueil*: Institut de Recherche en Informatique de Toulouse
Equipe : MELODI (*ME*thodes et ingénierie des *L*angues, des
*O*ntologies et du *Di*scours)

*Domaine scientifique *: Informatique**

*Mots clé *: ontologie, architecture textuelle, théorie du discours,
analyse sémantique du langage, TAL**

Les ontologies sont des structures de représentation des connaissances
basées sur un fondement logique, qui mettent en avant les concepts d'un
domaine, les relations entre ces concepts (relations sémantiques), ainsi
que les axiomes et contraintes impliquant ces concepts et relations.
Elles contribuent grandement au développement du Web sémantique et sont
particulièrement présentes dans les domaines tels que l’extraction
d’information, l’indexation de documents, l’explicitation d’une
recherche d’information, le résumé automatique, etc.

La construction d'ontologie à partir de textes s'appuie jusqu'ici sur
des analyses statistiques et/ou des analyses linguistiques
essentiellement focalisées sur les niveaux lexicaux et syntaxiques.
Partant du constat que la mise en forme matérielle d’un texte contribue
à lui donner du sens, l’idée est d’exploiter les objets textuels
(segments de texte rendus perceptibles à la surface du texte par leur
mise en forme matérielle) porteurs de relations hiérarchiques entre
leurs différents constituants (constituants qui ne sont pas forcément
contigus dans le texte). L’objectif est donc d’élargir les méthodes de
construction d’ontologie à partir de textes en analysant les structures
discursives bénéficiant de mises en forme régulières.

La thèse a donc pour but, dans un premier temps, de formaliser certaines
structures discursives spécifiques selon une théorie du discours et un
modèle d’architecture textuelle. Il s’agira ensuite de caractériser un
ensemble d’indices syntaxico-sémantiques qui permettront tout d’abord
d’identifier automatiquement ces structures discursives, puis d’extraire
automatiquement de ces structures les connaissances ontologiques
qu’elles contiennent. Une des difficultés majeures de ce travail
consistera à identifier d’une part les concepts présents non seulement
dans les différents segments composant la structure mais aussi dans les
segments appartenant au « contexte » de la structure, et d’autre part la
nature (ontologique ou lexicale) de la ou les relations portées par la
structure. Une étude entre une approche symbolique et une approche par
apprentissage doit être envisagée. Enfin, ce travail devra permettre
d’affiner les méthodes de construction d’ontologie (DAFOE et Terminae) à
la définition desquelles contribue l’équipe MELODI.

*Financement :* Ce sujet est prioritaire pour une demande de bourse de
thèse du ministère.

*Candidatures* : Les candidats intéressés sont invités à envoyer une
lettre de motivation, un CV, un relevé de notes avec classement au
Master le plus tôt possible, avant le 20 avril 2012. Une seconde
sélection sera ensuite faite par l’école doctorale sur la base d’une
audition début mai 2012.

-------------------------------------------------------------------------
Message diffuse par la liste Langage Naturel <LN at cines.fr>
Informations, abonnement : http://www.atala.org/article.php3?id_article=48
English version       : 
Archives                 : http://listserv.linguistlist.org/archives/ln.html
                                http://liste.cines.fr/info/ln

La liste LN est parrainee par l'ATALA (Association pour le Traitement
Automatique des Langues)
Information et adhesion  : http://www.atala.org/
-------------------------------------------------------------------------



More information about the Ln mailing list