Sujet de these: Extraction d=?WINDOWS-1252?Q?=92informations_?=pertinentes guidee par une ressource termino-ontologique, LIRMM

Thierry Hamon thierry.hamon at UNIV-PARIS13.FR
Wed May 23 19:04:10 UTC 2012


Date: Sun, 20 May 2012 22:31:36 +0200
From: Mathieu Roche <Mathieu.Roche at lirmm.fr>
Message-ID: <424e0911c1729b25f22e54694178105e at lirmm.fr>
X-url: http://www.lirmm.fr/~dony/sdinfo/concours.html
X-url: http://umr-iate-travail.cirad.fr/axes-de-recherche/ingenierie-des-connaissances/presentation)
X-url: http://www.lirmm.fr/tal/)
X-url: http://www.paris.inra.fr/metarisk/research_unit/knowledge_engineering)

 Offre de sujet de thèse pour la rentrée 2012

 Titre: Extraction d’informations pertinentes dans le texte et les
 tableaux d’un document scientifique guidée par une ressource
 termino-ontologique

 Co-financement: INRA-Labex NumEv

 Lieu de la thèse : Montpellier (LIRMM et UMR IATE)

 Procédure à suivre pour candidater :
 http://www.lirmm.fr/~dony/sdinfo/concours.html

 Date limite pour candidater : 31 Mai 2012

 Co-encadrants:

 Patrice Buche (INRA IATE/GraphIK LIRMM),
 Contact : Patrice.Buche at supagro.inra.fr 
 (http://umr-iate-travail.cirad.fr/axes-de-recherche/ingenierie-des-connaissances/presentation)

 Mathieu Roche (TEXTE LIRMM),
 Contact : Mathieu.Roche at lirmm.fr (http://www.lirmm.fr/tal/)

 Juliette Dibie-Barthélemy (AgroParisTech/INRA Mét at risk),
 Contact : dibie at agroparistech.fr 
 (http://www.paris.inra.fr/metarisk/research_unit/knowledge_engineering)


 Présentation du sujet:

 L’objectif de cette thèse est de concevoir une méthode originale
 d’extraction d’information pertinente provenant de textes et de
 tableaux extraits de sources de données hétérogènes (articles
 scientifiques, rapports de projets, …). Une information pertinente est
 définie dans par une relation n-aire associant un objet d’étude à ses
 caractéristiques (par exemple : un emballage à son épaisseur, sa
 perméabilité à l’O2, …).  Les informations sont extraites afin d’être
 utilisées dans des outils d’aide à la décision (par exemple : aide à la
 conception d’emballages, simulation d’une bio-raffinerie virtuelle).

 Le sujet de cette thèse s’inscrit dans le domaine de l’ingénierie des
 connaissances. La méthode proposée s’appuiera sur une Ressource
 Termino-Ontologique (RTO) qui permet de modéliser, dans un format
 structuré, la connaissance du domaine d’application considéré.
 L’extraction et la représentation de l’information pertinente reposera
 sur : (1) des méthodes de traitement automatique de la langue afin de
 définir des patrons morphosyntaxiques et sémantiques pour identifier
 les informations pertinentes dans le texte ; (2) , des méthodes
 d’annotation sémantique de tableaux de données pour identifier les
 informations pertinentes dans les tableaux ; (3) la théorie des
 ensembles flous et des possibilités pour représenter et interroger de
 manière flexible des données imprécises (intervalles de valeurs,
 moyenne et écart-type,…) préalablement extraites des sources de
 données.

 Afin de tester la généricité de l’approche proposée, deux domaines
 d’application seront étudiés : 1) la conception d’emballages
 biodégradables issus de ressources renouvelables ; 2) dans le cadre du
 projet européen EcoBioCap et du projet ANR Map'Opt ; 2) la
 bio-raffinerie dans le cadre du programme prioritaire du département
 INRA CEPIA (Caractérisation et élaboration de produits issus de
 l'agriculture) « Biomasse ligno-cellulosique ».

-------------------------------------------------------------------------
Message diffuse par la liste Langage Naturel <LN at cines.fr>
Informations, abonnement : http://www.atala.org/article.php3?id_article=48
English version       : 
Archives                 : http://listserv.linguistlist.org/archives/ln.html
                                http://liste.cines.fr/info/ln

La liste LN est parrainee par l'ATALA (Association pour le Traitement
Automatique des Langues)
Information et adhesion  : http://www.atala.org/
-------------------------------------------------------------------------



More information about the Ln mailing list