[Corpora-List] PhD position: Document design and textual interaction for helping reading processes (IRIT, University of Toulouse, France)

mai hodac hodac at univ-tlse2.fr
Sun Mar 17 10:02:17 UTC 2013


*PhD position: Document design and textual interaction for helping reading
processes (IRIT, University of Toulouse, France)*

*IRIT* (Institut de Recherche en Informatique de Toulouse – Toulouse
Institute of Computer Science Research), a CNRS research laboratory in
Computer Science offers on doctoral position rooted in a multidisciplinary
reasearch involving natural language processing, ergonomy, human computer
interaction. The main objective of the study is to develop a language for
representing procedural texts' organisation and an interactional model for
improving text readability for target reader populations. Corpus studies
for eliciting relevant discourse structures will be conducted and an
experimental platform will be developped for evaluating their effect on
reading processes. More details are given in the original proposal (below).

*Qualifications*
* Master´s degree in Computer Science, Computational Linguistics, or the
equivalent.
* Excellent command of French and English.

*Application deadline: 20 March, 2013.
*
*Contact:* mustapha.mojahid at irit.fr



Original proposal (French) :

*Sujet de la thèse : *

Présentation et interaction textuelle pour l'aide à des processus
cognitifs

*Contexte et objectifs généraux de la thèse*

Le sujet de la thèse s'inscrit dans une recherche pluridisciplinaire,
informatique textuelle, interaction et ergonomie. Il fait appel
également à des paradigmes multi-agents.

Nous visons deux objectifs essentiels dans cette thèse :

1 étudier et mesurer l'apport de l'architecture textuelle d'un texte
  procédural (instructionnel), et de la présentation/visualisation de
  l'information dans l'amélioration des processus cognitifs chez des
  personnes ayant des troubles cognitifs liés à la mémoire, à la
  perception et à la résolution de problèmes. Nous étudierons de manière
  approfondie les processus d'interaction avec l'utilisateur lors des
  différentes lectures du texte pendant la réalisation des tâches,
  correspondant au texte procédural, induites par ses différents niveaux
  de structure du discours.

2 développer une plateforme expérimentale intégrant les modèles élaborés
  et évaluer auprès d'usagers l'efficacité cognitive de notre approche
  de la présentation et de l'interaction. Cette plateforme nous
  permettra d'explorer et de formaliser le cycle classique des processus
  perception-cognition-action dans un contexte où plusieurs acteurs sont
  concernés, particulièrement : un ergothérapeute, un ergonome, un
  linguiste, un informaticien et un éditeur de logiciels spécialisés.

Le but final est de définir un langage de présentation et un modèle
d'interaction qui s'adaptera à l'utilisateur et à son handicap.

Du point de vue de l'adaptation à l'usager, le sujet de la thèse traite
de l'aide que l'on peut apporter à des personnes âgées ou des personnes
avec des déficiences cognitives à travers l'interaction qu'elles peuvent
avoir avec des textes (comme les consignes de sécurité, les recettes de
cuisines ou les manuels de modes d'emploi, qui peuvent être récupérés
sur le web), pour les mémoriser, les comprendre et réaliser les tâches
que ces textes impliquent.

*Déroulement de la thèse*

Pour mener à bien ce travail, nous distinguons trois étapes :

*Etape 1 :* On se focalisera sur *l'étude d'un corpus* particulier
regroupant différents types de texte à consignes (consignes de sécurité,
prescriptions médicales, modes d'emploi d'appareils médicaux ou autres,
ou recettes de cuisine). Le travail consistera à définir des stratégies
d'analyse de ces textes, en s'appuyant sur les indices discursifs et de
mise en forme matérielle (Modèle d'architecture textuels, théorie des
structures rhétoriques, questionnabilité des textes) (Luc, 2001 ; Mann &
Thomson 1988 ; Chali 1997). Deux objets textuels seront particulièrement
étudiés du fait de leur forte capacité à organiser les contenus : les
énumérations et les titres (Ho-dac /et al.,/ 2012 ; Luc /et al./ 1999).
Nous ferons appel également à des ontologies pour enrichir l'étiquetage
sémantique (Handschuh & Staab, 2003). Il s'agira d'identifier parmi les
différents niveaux de structure (définis par les relations entre
segments de discours) ceux impliqués dans les activités sous jacentes
pour préparer et réaliser les différentes actions prenant en compte les
conditions et les précautions nécessaires. Le but est d'élaborer, en
s'appuyant sur le modèle des images de pages (Mojahid, 2011), un langage
pour (1) représenter et visualiser les différents niveaux de structure
en prenant en compte le concept de granularité des contenus et (2) gérer
les différents processus associés à ces structures pour aider à la
réalisation de la tâche et gérer les différentes interactions.

Cette étape, fondamentale dans la thèse, concerne la représentation des
structures de contenu. En effet, une dessituations « réelles » et la
problématique dans lesquelles peut se trouver l'utilisateur pourrait se
traduire par le besoin d'extraire du web les parties et segments du
documents qui correspondraient à ses besoins pour la réalisation de
l'ensemble des tâches. L'élaboration du modèle de représentation
nécessite ainsi le calcul de la structure interne des pages web
considérées ; les structures des pages web répondent cependant à des
contraintes d'accessibilité et de production qui permettent d'aborder
cette problématique sous l'angle plus spécifique de l'extraction
d'information. D'un point de vue méthodologique, nous distinguerons les
deux niveaux de structuration : macro et micro segmentation.

Nous aborderons le texte comme un tout dont la structure « élastique »
n'est pas connue d'avance. Cette approche constitue l'hypothèse du
modèle d'architecture textuelle qui repose sur la prise en compte de
l'intention architecturante de l'auteur (Virbel, 1989) et des différents
acteurs textuels concernés par l'ensemble de toute la chaîne de
production.

Cette recherche sera menée en collaboration avec une spécialiste en
linguistique textuelle, Mai Ho-Dac du laboratoire CLLE-ERSS-Université
du Mirail.

Cette première partie de la thèse comportera une étude de l'état de
l'art des travaux liés au corpus sur l'analyse du discours et des
structures textuelles.

*L'étape 2* consiste à *développer un outil expérimental* intégrant des
interactions tactilo-orale pour permettre à l'usager de progresser dans
ses tâches de lecture, de compréhension et de réalisation. Les
composantes ergonomiques et les critères d'utilisabilités seront à
considérer.

Les spécifications de l'outil que l'on se propose de développer sont
très proches dans le cas des recettes de cuisine des objectifs du
dernier workshop « Cooking with Computers (CwC) » de l'édition 2013 de
l'IJCAI. Nous chercherons à répondre aux questions :

La représentation des connaissances, la structuration du contenu, le
raisonnement, la planification, le traitement automatique des langues
peuvent-ils nous aider à cuisiner ?

*L'étape 3*correspond à la phase de *validation*. Une des spécificités
de la thèse est de mettre à l'épreuve les modèles et les outils
développés dans un contexte de réalisation de tâches par des personnes
ayant des déficiences cognitives. Nous travaillerons dans cette étapes
en partenariat avec des ergothérapeutes, ergonomes, créateurs de sites
internet, et éditeurs de logiciels.**Une motivation de ces
partenaires**est de favoriser aux usagers le maintien à domicile.


*Bibliographie*

Andonoff E., Bouaziz W., Hanachi C., (2007) Protocol Management Systems
as a Middleware for Inter-Organizational Workflow Coordination /,
International Journal on Computer Science and Applications,/ Vol. 4,
n°2, p. 23--41.

Chali Y. (1997) /L'expansion de texte Une approche basée sur
l'explication par questions/réponses pour la génération de versions de
textes/. Thèse de l'Université Paul Sabatier.

Etcheverry, I., Baccino, T., Terrier, P., Marquié, J-C, Mojahid, M.
(2012). Age differences in information finding tasks: performance and
visual exploration strategy with different page layouts./Computers in
Human Behavior/, Elsevier, 2012.

Hanachi C.,** Sibertin-Blanc C., (2004) Protocol Moderators as Active
Middle-Agents, /Autonomous Agents and Multi-Agent Systems/, 8(2):
131-164.

Handschuh, S., Staab, S. (2003) Annotation for the semantic web,
Frontiers in Artificial Intelligence and Applications, 96, Ios PressInc.

Ho-Dac L-M., Fabre, C., Péry-Woodley, M-P., Rebeyrolle J., Tanguy L.
(2012) An Empirical Approach to the Signalling of Enumerative
Structures, /Discours/, http://discours.revues.org/8611.

Luc, C., Mojahid, M., Virbel, J., Garcia-Debanc, C. & Péry-Woodley, M-P.
(1999) A linguistic approach to some parameters of layout: A study of
enumerations. In R. Power & D. Scott (Eds.), /Using Layout for the
Generation, Understanding or Retrieval of Documents,/ AAAI 1999 Fall
Symposium, pp. 20-29. (aussi /AAAI Fall Symposium Technical Report/
FS-99-04, pp. 35-45).

Luc C. (2000) /Représentation et composition des structures visuelles et
rhétoriques du texte, Approche /pour la génération de textes formatés.
Thèse de l'Université Paul Sabatier, Toulouse.

Mann, W.C., & Thompson, S.A. (1988) Rhetorical Structure Theory: Toward
a functional theory of text organization. /Text/, 8 (3). 243-281.

Mojahid, M. (2011) The Foundations and Testing of Page Images Language
(IdP). /Linguistic and Psycholinguistic Approaches to Text Structuring
(LPTS 2011)/, /Louvain, Belgique/, Université Catholique de Louvain.

Virbel Jacques, Garcia-Debanc Claudine, Baccino Thierry, Carrio
Laetitia, Dominguez Corinne, Jacquemin Christian, Luc Christophe,
Mojahid Mustapha, Pery-Woodley Marie-Paule, Schmids Sabine. (2005)
Approches cognitives de la spatialisation du langage. De la modélisation
de structures spatio-linguistiques des textes à l'expérimentation
psycholinguistique : le cas d'un objet textuel, l'énumération. /Agir
dans l'espace/. Catherine Thinus-Blanc, Jean Bullier (Eds.), Editions de
la Maison des sciences de l'homme, p. 233-254, Cognitique.

Virbel, J. (1989) The contribution of linguistic knowledge to the
interpretation of text structure. Dans André, J., Quint, V. et Furuta,
R. (eds), /Structured Documents/, 161--181. Cambridge University Press.

*Equipe d'encadrement et contact*

Directeur : Chihab Hanachi, SMAC-IRIT (chihab.hanachi at irit.fr)

Co-encadrement : Mustapha Mojahid, ELIPSE-IRIT (mustapha.mojahid at irit.fr)

Mai Ho-Dac, ERSS-CLLE (hodac at univ-tlse2.fr)

*Financement :* bourse axe Santé & Autonomie de l'IRIT (Institut de
Recherche en Informatique de Toulouse -- UMR 5505.

*Merci de nous contacter le plus rapidement possible :*
mustapha.mojahid at irit.fr

*Prérequis et exigences*

Connaissances en TAL et/ou IHM et anglais courant

Bonne position du candidat : Licence, Master 1 et Master 2 si possible.
-------------- next part --------------
An HTML attachment was scrubbed...
URL: <http://listserv.linguistlist.org/pipermail/corpora/attachments/20130317/0ce0420d/attachment.htm>
-------------- next part --------------
_______________________________________________
UNSUBSCRIBE from this page: http://mailman.uib.no/options/corpora
Corpora mailing list
Corpora at uib.no
http://mailman.uib.no/listinfo/corpora


More information about the Corpora mailing list