Sujet de these: Desambiguisation Semantique dans le cadre de la Simplification Lexicale, BLRI, LIF
Thierry Hamon
hamon at LIMSI.FR
Sun Apr 6 08:09:09 UTC 2014
Date: Wed, 02 Apr 2014 11:41:11 +0200
From: Nuria Gala <Nuria.Gala at lif.univ-mrs.fr>
Message-ID: <533BDB37.4020408 at lif.univ-mrs.fr>
X-url: http://147.94.196.238/index.html
*Le Labex /Brain and Language Research Institute/ (BLRI) financera à la
rentrée 2014 deux bourses de thèses dans le périmètre du Labex*
http://147.94.196.238/index.html
Dans le cadre du BLRI, l'*équipe TALEP du Laboratoire d'Informatique
Fondamentale (LIF-**CNRS**) *propose un sujet de thèse dans le domaine
de la lisibilité et la simplification lexicale.
/*Désambiguïsation Sémantique dans le cadre de la Simplification
Lexicale */
Le sujet de recherche s'inscrit dans une recherche pluridisciplinaire en
traitement automatique des langues (TAL), linguistique et
psycholinguistique.
Le domaine de la lisibilité et de la simplification est en plein essor
en TAL. Dans ce domaine, l'objectif principal est d'estimer le degré de
difficulté d'un texte et d'en proposer une version simplifiée, adaptée
aux besoins d'un public particulier : apprenants d'une langue, personnes
avec peu d'instruction ou atteintes d'une pathologie qui entraîne des
difficultés de lecture (dyslexie, aphasie, etc.). Une des sous-tâches du
domaine est la simplification lexicale, c'est-à-dire, le remplacement
d'un mot par un équivalent ayant le même sens (synonyme) mais plus
accessible d'un point de vue de sa compréhension.
Le processus de simplification lexicale se heurte à un problème de
taille en TAL, celui de la désambiguïsation sémantique (indispensable à
d'autres applications comme la traduction automatique, etc.). Dans ce
contexte, il s'agit de sélectionner automatiquement le sens le plus
approprié en contexte. Pour ce faire, deux étapes doivent être
envisagées : identifier le sens et lever l'ambiguïté puis simplifier. La
difficulté ajoutée est que l'on doit choisir le mot du même sens le plus
adapté, d'un point de vue de sa facilité de compréhension, pour un
public donné. Ceci peut entraîner des difficultés supplémentaires au
niveau de la syntaxe de la phrase (transformations) qui doivent être
prises en compte au moment de l'analyse.
Ce sujet de thèse vise, ainsi, les objectifs suivants :
a) identifier les besoins liés à un public de mauvais lecteurs, enfants
dyslexiques et enfants sourds, caractériser les particularités
entraînant des difficultés lexicales au moment de la lecture ;
b) étudier les méthodes de désambiguïsation sémantique existantes en TAL
afin de les adapter à la tâche de simplification lexicale (méthodes
basées sur les connaissances -ressources existantes- ou sur corpus) ;
c) développer un modèle de désambiguïsation sémantique permettant de
choisir le bon sens en contexte parmi une liste de candidats, puis
choisir un équivalent le plus adapté ;
d) contribuer à l'enrichissement de ressources lexicales intégrant des
informations sur le degré de difficulté d'un mot-sens.
La thèse sera dirigée par Núria Gala, en collaboration avec Johannes
Ziegler, directeur du Laboratoire de Psychologie Cognitive (LPC) à
Marseille, spécialiste des troubles de l'apprentissage de la lecture.
Le dossier de candidature doit comporter :
* la description scientifique du projet (< 5 pages, à rédiger en
accord avec les directeurs de thèse) : titre, résumé, contexte,
méthodologie/expériences envisagées, résultats attendus, calendrier
prévisionnel
* un argumentaire montrant la pertinence du projet pour le BLRI
* un CV détaillé
* une lettre de motivation
Date limite des candidatures : 20 Mai 2014
Pré-sélection des candidats à auditionner le 5 Juin 2014
Auditions des candidats retenus : 18 Juin 2014
Démarrage : 1^er septembre 2014
Bourse : 1 684.93EUR brut mensuel (1 368EUR net) contrat de 3 ans
Les candidats intéressés devront contacter : nuria.gala at lif.univ-mrs.fr
Pour tout renseignement complémentaire : Johannes.Ziegler at univ-amu.fr
Pour tout renseignement administratif : nadera.bureau at blri.fr
-------------------------------------------------------------------------
Message diffuse par la liste Langage Naturel <LN at cines.fr>
Informations, abonnement : http://www.atala.org/article.php3?id_article=48
English version :
Archives : http://listserv.linguistlist.org/archives/ln.html
http://liste.cines.fr/info/ln
La liste LN est parrainee par l'ATALA (Association pour le Traitement
Automatique des Langues)
Information et adhesion : http://www.atala.org/
ATALA décline toute responsabilité concernant le contenu des
messages diffusés sur la liste LN
-------------------------------------------------------------------------
More information about the Ln
mailing list