<b>PhD position: Document design and textual interaction for helping reading processes (IRIT, University of Toulouse, France)</b><br><br><b>IRIT</b> (Institut de Recherche en Informatique de Toulouse – Toulouse Institute of Computer Science Research), a CNRS research laboratory in Computer Science offers on doctoral position rooted in a multidisciplinary reasearch involving natural language processing, ergonomy, human computer interaction. The main objective of the study is to develop a language for representing procedural texts' organisation and an interactional model for improving text readability for target reader populations. Corpus studies for eliciting relevant discourse structures will be conducted and an experimental platform will be developped for evaluating their effect on reading processes. More details are given in the original proposal (below).<br>


<div style="color:rgb(34,34,34);font-size:13px;font-family:arial,sans-serif">

<br><b>Qualifications</b></div><div style="color:rgb(34,34,34);font-size:13px;font-family:arial,sans-serif">* Master´s degree in Computer Science, Computational Linguistics, or the equivalent.</div>* Excellent command of French and English.<br>


<br><b>Application deadline: 20 March, 2013.<br></b><div style="color:rgb(34,34,34);font-size:13px;font-family:arial,sans-serif"><b>Contact:</b> <a href="mailto:mustapha.mojahid@irit.fr" target="_blank">mustapha.mojahid@irit.fr</a></div>


<br><br><br><div class="gmail_quote">Original proposal (French) : <br><br>*Sujet de la thèse : *<br>


<br>

Présentation et interaction textuelle pour l'aide à des processus<br>

cognitifs<br>

<br>

*Contexte et objectifs généraux de la thèse*<br>

<br>

Le sujet de la thèse s'inscrit dans une recherche pluridisciplinaire,<br>

informatique textuelle, interaction et ergonomie. Il fait appel<br>

également à des paradigmes multi-agents.<br>

<br>

Nous visons deux objectifs essentiels dans cette thèse :<br>

<br>

1 étudier et mesurer l'apport de l'architecture textuelle d'un texte<br>

  procédural (instructionnel), et de la présentation/visualisation de<br>

  l'information dans l'amélioration des processus cognitifs chez des<br>

  personnes ayant des troubles cognitifs liés à la mémoire, à la<br>

  perception et à la résolution de problèmes. Nous étudierons de manière<br>

  approfondie les processus d'interaction avec l'utilisateur lors des<br>

  différentes lectures du texte pendant la réalisation des tâches,<br>

  correspondant au texte procédural, induites par ses différents niveaux<br>

  de structure du discours.<br>

<br>

2 développer une plateforme expérimentale intégrant les modèles élaborés<br>

  et évaluer auprès d'usagers l'efficacité cognitive de notre approche<br>

  de la présentation et de l'interaction. Cette plateforme nous<br>

  permettra d'explorer et de formaliser le cycle classique des processus<br>

  perception-cognition-action dans un contexte où plusieurs acteurs sont<br>

  concernés, particulièrement : un ergothérapeute, un ergonome, un<br>

  linguiste, un informaticien et un éditeur de logiciels spécialisés.<br>

<br>

Le but final est de définir un langage de présentation et un modèle<br>

d'interaction qui s'adaptera à l'utilisateur et à son handicap.<br>

<br>

Du point de vue de l'adaptation à l'usager, le sujet de la thèse traite<br>

de l'aide que l'on peut apporter à des personnes âgées ou des personnes<br>

avec des déficiences cognitives à travers l'interaction qu'elles peuvent<br>

avoir avec des textes (comme les consignes de sécurité, les recettes de<br>

cuisines ou les manuels de modes d'emploi, qui peuvent être récupérés<br>

sur le web), pour les mémoriser, les comprendre et réaliser les tâches<br>

que ces textes impliquent.<br>

<br>

*Déroulement de la thèse*<br>

<br>

Pour mener à bien ce travail, nous distinguons trois étapes :<br>

<br>

*Etape 1 :* On se focalisera sur *l'étude d'un corpus* particulier<br>

regroupant différents types de texte à consignes (consignes de sécurité,<br>

prescriptions médicales, modes d'emploi d'appareils médicaux ou autres,<br>

ou recettes de cuisine). Le travail consistera à définir des stratégies<br>

d'analyse de ces textes, en s'appuyant sur les indices discursifs et de<br>

mise en forme matérielle (Modèle d'architecture textuels, théorie des<br>

structures rhétoriques, questionnabilité des textes) (Luc, 2001 ; Mann &<br>

Thomson 1988 ; Chali 1997). Deux objets textuels seront particulièrement<br>

étudiés du fait de leur forte capacité à organiser les contenus : les<br>

énumérations et les titres (Ho-dac /et al.,/ 2012 ; Luc /et al./ 1999).<br>

Nous ferons appel également à des ontologies pour enrichir l'étiquetage<br>

sémantique (Handschuh & Staab, 2003). Il s'agira d'identifier parmi les<br>

différents niveaux de structure (définis par les relations entre<br>

segments de discours) ceux impliqués dans les activités sous jacentes<br>

pour préparer et réaliser les différentes actions prenant en compte les<br>

conditions et les précautions nécessaires. Le but est d'élaborer, en<br>

s'appuyant sur le modèle des images de pages (Mojahid, 2011), un langage<br>

pour (1) représenter et visualiser les différents niveaux de structure<br>

en prenant en compte le concept de granularité des contenus et (2) gérer<br>

les différents processus associés à ces structures pour aider à la<br>

réalisation de la tâche et gérer les différentes interactions.<br>

<br>

Cette étape, fondamentale dans la thèse, concerne la représentation des<br>

structures de contenu. En effet, une dessituations « réelles » et la<br>

problématique dans lesquelles peut se trouver l'utilisateur pourrait se<br>

traduire par le besoin d'extraire du web les parties et segments du<br>

documents qui correspondraient à ses besoins pour la réalisation de<br>

l'ensemble des tâches. L'élaboration du modèle de représentation<br>

nécessite ainsi le calcul de la structure interne des pages web<br>

considérées ; les structures des pages web répondent cependant à des<br>

contraintes d'accessibilité et de production qui permettent d'aborder<br>

cette problématique sous l'angle plus spécifique de l'extraction<br>

d'information. D'un point de vue méthodologique, nous distinguerons les<br>

deux niveaux de structuration : macro et micro segmentation.<br>

<br>

Nous aborderons le texte comme un tout dont la structure « élastique »<br>

n'est pas connue d'avance. Cette approche constitue l'hypothèse du<br>

modèle d'architecture textuelle qui repose sur la prise en compte de<br>

l'intention architecturante de l'auteur (Virbel, 1989) et des différents<br>

acteurs textuels concernés par l'ensemble de toute la chaîne de<br>

production.<br>

<br>

Cette recherche sera menée en collaboration avec une spécialiste en<br>

linguistique textuelle, Mai Ho-Dac du laboratoire CLLE-ERSS-Université<br>

du Mirail.<br>

<br>

Cette première partie de la thèse comportera une étude de l'état de<br>

l'art des travaux liés au corpus sur l'analyse du discours et des<br>

structures textuelles.<br>

<br>

*L'étape 2* consiste à *développer un outil expérimental* intégrant des<br>

interactions tactilo-orale pour permettre à l'usager de progresser dans<br>

ses tâches de lecture, de compréhension et de réalisation. Les<br>

composantes ergonomiques et les critères d'utilisabilités seront à<br>

considérer.<br>

<br>

Les spécifications de l'outil que l'on se propose de développer sont<br>

très proches dans le cas des recettes de cuisine des objectifs du<br>

dernier workshop « Cooking with Computers (CwC) » de l'édition 2013 de<br>

l'IJCAI. Nous chercherons à répondre aux questions :<br>

<br>

La représentation des connaissances, la structuration du contenu, le<br>

raisonnement, la planification, le traitement automatique des langues<br>

peuvent-ils nous aider à cuisiner ?<br>

<br>

*L'étape 3*correspond à la phase de *validation*. Une des spécificités<br>

de la thèse est de mettre à l'épreuve les modèles et les outils<br>

développés dans un contexte de réalisation de tâches par des personnes<br>

ayant des déficiences cognitives. Nous travaillerons dans cette étapes<br>

en partenariat avec des ergothérapeutes, ergonomes, créateurs de sites<br>

internet, et éditeurs de logiciels.**Une motivation de ces<br>

partenaires**est de favoriser aux usagers le maintien à domicile.<br>

<br>

<br>

*Bibliographie*<br>

<br>

Andonoff E., Bouaziz W., Hanachi C., (2007) Protocol Management Systems<br>

as a Middleware for Inter-Organizational Workflow Coordination /,<br>

International Journal on Computer Science and Applications,/ Vol. 4,<br>

n°2, p. 23--41.<br>

<br>

Chali Y. (1997) /L'expansion de texte Une approche basée sur<br>

l'explication par questions/réponses pour la génération de versions de<br>

textes/. Thèse de l'Université Paul Sabatier.<br>

<br>

Etcheverry, I., Baccino, T., Terrier, P., Marquié, J-C, Mojahid, M.<br>

(2012). Age differences in information finding tasks: performance and<br>

visual exploration strategy with different page layouts./Computers in<br>

Human Behavior/, Elsevier, 2012.<br>

<br>

Hanachi C.,** Sibertin-Blanc C., (2004) Protocol Moderators as Active<br>

Middle-Agents, /Autonomous Agents and Multi-Agent Systems/, 8(2):<br>

131-164.<br>

<br>

Handschuh, S., Staab, S. (2003) Annotation for the semantic web,<br>

Frontiers in Artificial Intelligence and Applications, 96, Ios PressInc.<br>

<br>

Ho-Dac L-M., Fabre, C., Péry-Woodley, M-P., Rebeyrolle J., Tanguy L.<br>

(2012) An Empirical Approach to the Signalling of Enumerative<br>

Structures, /Discours/, <a href="http://discours.revues.org/8611" target="_blank">http://discours.revues.org/8611</a>.<br>

<br>

Luc, C., Mojahid, M., Virbel, J., Garcia-Debanc, C. & Péry-Woodley, M-P.<br>

(1999) A linguistic approach to some parameters of layout: A study of<br>

enumerations. In R. Power & D. Scott (Eds.), /Using Layout for the<br>

Generation, Understanding or Retrieval of Documents,/ AAAI 1999 Fall<br>

Symposium, pp. 20-29. (aussi /AAAI Fall Symposium Technical Report/<br>

FS-99-04, pp. 35-45).<br>

<br>

Luc C. (2000) /Représentation et composition des structures visuelles et<br>

rhétoriques du texte, Approche /pour la génération de textes formatés.<br>

Thèse de l'Université Paul Sabatier, Toulouse.<br>

<br>

Mann, W.C., & Thompson, S.A. (1988) Rhetorical Structure Theory: Toward<br>

a functional theory of text organization. /Text/, 8 (3). 243-281.<br>

<br>

Mojahid, M. (2011) The Foundations and Testing of Page Images Language<br>

(IdP). /Linguistic and Psycholinguistic Approaches to Text Structuring<br>

(LPTS 2011)/, /Louvain, Belgique/, Université Catholique de Louvain.<br>

<br>

Virbel Jacques, Garcia-Debanc Claudine, Baccino Thierry, Carrio<br>

Laetitia, Dominguez Corinne, Jacquemin Christian, Luc Christophe,<br>

Mojahid Mustapha, Pery-Woodley Marie-Paule, Schmids Sabine. (2005)<br>

Approches cognitives de la spatialisation du langage. De la modélisation<br>

de structures spatio-linguistiques des textes à l'expérimentation<br>

psycholinguistique : le cas d'un objet textuel, l'énumération. /Agir<br>

dans l'espace/. Catherine Thinus-Blanc, Jean Bullier (Eds.), Editions de<br>

la Maison des sciences de l'homme, p. 233-254, Cognitique.<br>

<br>

Virbel, J. (1989) The contribution of linguistic knowledge to the<br>

interpretation of text structure. Dans André, J., Quint, V. et Furuta,<br>

R. (eds), /Structured Documents/, 161--181. Cambridge University Press.<br>

<br>

*Equipe d'encadrement et contact*<br>

<br>

Directeur : Chihab Hanachi, SMAC-IRIT (<a href="mailto:chihab.hanachi@irit.fr" target="_blank">chihab.hanachi@irit.fr</a>)<br>

<br>

Co-encadrement : Mustapha Mojahid, ELIPSE-IRIT (<a href="mailto:mustapha.mojahid@irit.fr" target="_blank">mustapha.mojahid@irit.fr</a>)<br>

<br>

Mai Ho-Dac, ERSS-CLLE (<a href="mailto:hodac@univ-tlse2.fr" target="_blank">hodac@univ-tlse2.fr</a>)<br>

<br>

*Financement :* bourse axe Santé & Autonomie de l'IRIT (Institut de<br>

Recherche en Informatique de Toulouse -- UMR 5505.<br>

<br>

*Merci de nous contacter le plus rapidement possible :*<br>

<a href="mailto:mustapha.mojahid@irit.fr" target="_blank">mustapha.mojahid@irit.fr</a><br>

<br>

*Prérequis et exigences*<br>

<br>

Connaissances en TAL et/ou IHM et anglais courant<br>

<br>

Bonne position du candidat : Licence, Master 1 et Master 2 si possible.<br>

<br>

</div><br>