Sujet de these: Extraction d=?WINDOWS-1252?Q?=92informations_?=pertinentes guidee par une ressource termino-ontologique, LIRMM
Thierry Hamon
thierry.hamon at UNIV-PARIS13.FR
Wed May 23 19:04:10 UTC 2012
Date: Sun, 20 May 2012 22:31:36 +0200
From: Mathieu Roche <Mathieu.Roche at lirmm.fr>
Message-ID: <424e0911c1729b25f22e54694178105e at lirmm.fr>
X-url: http://www.lirmm.fr/~dony/sdinfo/concours.html
X-url: http://umr-iate-travail.cirad.fr/axes-de-recherche/ingenierie-des-connaissances/presentation)
X-url: http://www.lirmm.fr/tal/)
X-url: http://www.paris.inra.fr/metarisk/research_unit/knowledge_engineering)
Offre de sujet de thèse pour la rentrée 2012
Titre: Extraction d’informations pertinentes dans le texte et les
tableaux d’un document scientifique guidée par une ressource
termino-ontologique
Co-financement: INRA-Labex NumEv
Lieu de la thèse : Montpellier (LIRMM et UMR IATE)
Procédure à suivre pour candidater :
http://www.lirmm.fr/~dony/sdinfo/concours.html
Date limite pour candidater : 31 Mai 2012
Co-encadrants:
Patrice Buche (INRA IATE/GraphIK LIRMM),
Contact : Patrice.Buche at supagro.inra.fr
(http://umr-iate-travail.cirad.fr/axes-de-recherche/ingenierie-des-connaissances/presentation)
Mathieu Roche (TEXTE LIRMM),
Contact : Mathieu.Roche at lirmm.fr (http://www.lirmm.fr/tal/)
Juliette Dibie-Barthélemy (AgroParisTech/INRA Mét at risk),
Contact : dibie at agroparistech.fr
(http://www.paris.inra.fr/metarisk/research_unit/knowledge_engineering)
Présentation du sujet:
L’objectif de cette thèse est de concevoir une méthode originale
d’extraction d’information pertinente provenant de textes et de
tableaux extraits de sources de données hétérogènes (articles
scientifiques, rapports de projets, …). Une information pertinente est
définie dans par une relation n-aire associant un objet d’étude à ses
caractéristiques (par exemple : un emballage à son épaisseur, sa
perméabilité à l’O2, …). Les informations sont extraites afin d’être
utilisées dans des outils d’aide à la décision (par exemple : aide à la
conception d’emballages, simulation d’une bio-raffinerie virtuelle).
Le sujet de cette thèse s’inscrit dans le domaine de l’ingénierie des
connaissances. La méthode proposée s’appuiera sur une Ressource
Termino-Ontologique (RTO) qui permet de modéliser, dans un format
structuré, la connaissance du domaine d’application considéré.
L’extraction et la représentation de l’information pertinente reposera
sur : (1) des méthodes de traitement automatique de la langue afin de
définir des patrons morphosyntaxiques et sémantiques pour identifier
les informations pertinentes dans le texte ; (2) , des méthodes
d’annotation sémantique de tableaux de données pour identifier les
informations pertinentes dans les tableaux ; (3) la théorie des
ensembles flous et des possibilités pour représenter et interroger de
manière flexible des données imprécises (intervalles de valeurs,
moyenne et écart-type,…) préalablement extraites des sources de
données.
Afin de tester la généricité de l’approche proposée, deux domaines
d’application seront étudiés : 1) la conception d’emballages
biodégradables issus de ressources renouvelables ; 2) dans le cadre du
projet européen EcoBioCap et du projet ANR Map'Opt ; 2) la
bio-raffinerie dans le cadre du programme prioritaire du département
INRA CEPIA (Caractérisation et élaboration de produits issus de
l'agriculture) « Biomasse ligno-cellulosique ».
-------------------------------------------------------------------------
Message diffuse par la liste Langage Naturel <LN at cines.fr>
Informations, abonnement : http://www.atala.org/article.php3?id_article=48
English version :
Archives : http://listserv.linguistlist.org/archives/ln.html
http://liste.cines.fr/info/ln
La liste LN est parrainee par l'ATALA (Association pour le Traitement
Automatique des Langues)
Information et adhesion : http://www.atala.org/
-------------------------------------------------------------------------
More information about the Ln
mailing list