Sujet de these: Desambiguisation Semantique dans le cadre de la Simplification Lexicale, BLRI, LIF

Thierry Hamon hamon at LIMSI.FR
Sun Apr 6 08:09:09 UTC 2014


Date: Wed, 02 Apr 2014 11:41:11 +0200
From: Nuria Gala <Nuria.Gala at lif.univ-mrs.fr>
Message-ID: <533BDB37.4020408 at lif.univ-mrs.fr>
X-url: http://147.94.196.238/index.html

*Le Labex /Brain and Language Research Institute/ (BLRI) financera à la
rentrée 2014 deux bourses de thèses dans le périmètre du Labex*

http://147.94.196.238/index.html


Dans le cadre du BLRI, l'*équipe TALEP du Laboratoire d'Informatique 
Fondamentale (LIF-**CNRS**) *propose un sujet de thèse dans le domaine 
de la lisibilité et la simplification lexicale.


/*Désambiguïsation Sémantique dans le cadre de la Simplification 
Lexicale */

Le sujet de recherche s'inscrit dans une recherche pluridisciplinaire en
traitement automatique des langues (TAL), linguistique et
psycholinguistique.

Le domaine de la lisibilité et de la simplification est en plein essor
en TAL. Dans ce domaine, l'objectif principal est d'estimer le degré de
difficulté d'un texte et d'en proposer une version simplifiée, adaptée
aux besoins d'un public particulier : apprenants d'une langue, personnes
avec peu d'instruction ou atteintes d'une pathologie qui entraîne des
difficultés de lecture (dyslexie, aphasie, etc.). Une des sous-tâches du
domaine est la simplification lexicale, c'est-à-dire, le remplacement
d'un mot par un équivalent ayant le même sens (synonyme) mais plus
accessible d'un point de vue de sa compréhension.

Le processus de simplification lexicale se heurte à un problème de
taille en TAL, celui de la désambiguïsation sémantique (indispensable à
d'autres applications comme la traduction automatique, etc.). Dans ce
contexte, il s'agit de sélectionner automatiquement le sens le plus
approprié en contexte. Pour ce faire, deux étapes doivent être
envisagées : identifier le sens et lever l'ambiguïté puis simplifier. La
difficulté ajoutée est que l'on doit choisir le mot du même sens le plus
adapté, d'un point de vue de sa facilité de compréhension, pour un
public donné. Ceci peut entraîner des difficultés supplémentaires au
niveau de la syntaxe de la phrase (transformations) qui doivent être
prises en compte au moment de l'analyse.

Ce sujet de thèse vise, ainsi, les objectifs suivants :

a) identifier les besoins liés à un public de mauvais lecteurs, enfants
   dyslexiques et enfants sourds, caractériser les particularités
   entraînant des difficultés lexicales au moment de la lecture ;

b) étudier les méthodes de désambiguïsation sémantique existantes en TAL
   afin de les adapter à la tâche de simplification lexicale (méthodes
   basées sur les connaissances -ressources existantes- ou sur corpus) ;

c) développer un modèle de désambiguïsation sémantique permettant de
   choisir le bon sens en contexte parmi une liste de candidats, puis
   choisir un équivalent le plus adapté ;

d) contribuer à l'enrichissement de ressources lexicales intégrant des
   informations sur le degré de difficulté d'un mot-sens.

La thèse sera dirigée par Núria Gala, en collaboration avec Johannes
Ziegler, directeur du Laboratoire de Psychologie Cognitive (LPC) à
Marseille, spécialiste des troubles de l'apprentissage de la lecture.


Le dossier de candidature doit comporter :

  * la description scientifique du projet (< 5 pages, à rédiger en
    accord avec les directeurs de thèse) : titre, résumé, contexte,
    méthodologie/expériences envisagées, résultats attendus, calendrier
    prévisionnel

  * un argumentaire montrant la pertinence du projet pour le BLRI

  * un CV détaillé

  * une lettre de motivation

Date limite des candidatures : 20 Mai 2014

Pré-sélection des candidats à auditionner le 5 Juin 2014

Auditions des candidats retenus : 18 Juin 2014

Démarrage : 1^er septembre 2014

Bourse : 1 684.93EUR brut mensuel (1 368EUR net) contrat de 3 ans


Les candidats intéressés devront contacter : nuria.gala at lif.univ-mrs.fr 

Pour tout renseignement complémentaire : Johannes.Ziegler at univ-amu.fr 

Pour tout renseignement administratif : nadera.bureau at blri.fr 

-------------------------------------------------------------------------
Message diffuse par la liste Langage Naturel <LN at cines.fr>
Informations, abonnement : http://www.atala.org/article.php3?id_article=48
English version       : 
Archives                 : http://listserv.linguistlist.org/archives/ln.html
                                http://liste.cines.fr/info/ln

La liste LN est parrainee par l'ATALA (Association pour le Traitement
Automatique des Langues)
Information et adhesion  : http://www.atala.org/

ATALA décline toute responsabilité concernant le contenu des
messages diffusés sur la liste LN
-------------------------------------------------------------------------



More information about the Ln mailing list