Stage: Stage de Master 2, Analyse des citations et des enumerations dans les fora de sante, Toulouse
Thierry Hamon
hamon at LIMSI.FR
Sat Feb 8 10:51:47 UTC 2014
Date: Wed, 05 Feb 2014 16:43:23 +0100
From: Mustapha Mojahid <Mustapha.Mojahid at irit.fr>
Message-ID: <52F25C1B.2050808 at irit.fr>
X-url: http://www.msh-m.fr/programmes/programmes-2013/parlons-de-nous
Titre : Analyse des citations et des énumérations dans les fora de
santé.
*Lieu : *Laboratoire IRIT (Institut de Recherche en Informatique de
Toulouse), Université Paul Sabatier, Equipe ELIPSE (Etude de
L'Interaction Personne SystèmE).
Contexte et problématique
Ce sujet du stage se situe dans le cadre d'un projet national « Parlons
de nous »
(http://www.msh-m.fr/programmes/programmes-2013/parlons-de-nous) où l'on
étudie des fora de santé pour tenter de répondre à la question « à quoi
pensent les patients ? » et du projet interMSH qui lui fait suite.
Les forums de santé sont des lieux où les patients échangent de nombreux
points de vues, conseils, où ils s'interrogent et discutent, et ce dans
un contexte bien différent des têtes à têtes menées avec les
professionnels de santé, qui ont lieu dans une durée et un lieu
contraint. Le relatif anonymat des échanges, l'implication récurrente de
certains dans les forums, les questions débattues peuvent être
révélatrices de points de vue, de connaissances ou méconnaissances
d'informations médicales, d'alertes, en provenance du grand public. Dans
ce contexte éminemment subjectif, la caractérisation et la compréhension
des perceptions dans les fils de discussions des forums est difficile,
mais aussi particulièrement intéressante et instructive dans une
perspective d'amélioration des programmes de santé publique.
*Objectif du projet*
Un des objectifs du projet est de développer une plateforme pour aider
des chercheurs (linguistes, sociologues et psychologues) et des médecins
à observer certains comportements dans les fils de discussions dans des
fora de santé. Dans le cadre d'un travail de thèse en informatique lancé
cette année sur le sujet du contexte et des informations médicales, nous
avons initié cette plateforme.
La plateforme vise à proposer une interface qui permet de représenter
et visualiser schématiquement les fils discussions (ou extraits de ces
fils de discussions) de forums au travers de traits et critères que
les chercheurs vont choisir. On espère ainsi pouvoir associer à
certains schémas de discussions une qualité informationnelle du fil
étudié (exemple : une discussion qui diverge du thème initial et se
recentre entre 2 personnes habituées devient peut être un aparté hors
sujet). Les critères actuellement pris en compte sont de nature
contextuelle (les profils des utilisateurs (âge, sexe), le temps,
nombres d'interventions, la longueur des échanges, les
micro-échanges...). Nous souhaitons travailler sur l'exploration
d'autres critères qui prendront en considération des traitements
linguistiques des discussions afin de disposer d'un jeu de vues sur
les discussions. Nous souhaitons évaluer si ces informations
permettent de répondre à notre hypothèse de caractérisation des fils
de discussion.
*Objectif du stage*
Ce stage vise deux objectifs :
1. Explorer des pistes linguistiques pressenties comme
- étudier l'utilisation des citations : en effet les internautes se
citent et se répondent beaucoup au fil des discussions et visualiser
ces interconnections dans le fil de discussions nous permettraient
peut être d'en avoir une compréhension élargie ;
- connaitre les énumérations dans les fils de discussions (quels
indices discursifs et de mise en forme matérielle peut-on repérer et
qu'en déduire ?)
- analyser en utilisant les terminologies médicales existantes, les
proximités sémantiques entre les différents post de discussion dans
un fil.
2. élaborer des stratégies pour coupler les indices de l'architecture de
texte et ceux liés au contexte (profil de l'usager, thématique
abordée, statut du message dans la discussion, etc.). Ce travail se
fera en collaboration avec le doctorant.
Nous souhaitons en effet dans cette plateforme, en manipulant des jauges
constituées par ces critères, observer et pouvoir caractériser comment
se construisent les réponses ? Est-ce que les réponses sont fournies par
des habitués ou des béotiens ? Peut-on écarter certaines discussions
(vulgarité, éparpillement...), ou au contraire anticiper sur des
contenus plutôt informatifs voire cruciaux ? Quels rebondissements ?
Quels recentrages ?... Nous nous focaliserons sur un sous-ensemble de
ces besoins.
La plate-forme « configurable »envisagée doit permettre aux chercheurs /
médecins de pouvoir observer des comportements et des « histoires de
discussion » stéréotypés.
*Perspectives *
Deux thèses possibles dans la continuité de ce sujet de master (1. sur
l'étude des énumérations dans les manuels scolaires d'histoire
géographie 2.sur l'amélioration de l'accessibilité textuelle pour des
personnes non-voyantes).
*Modalités du stage *
Encadrants :
Lydia-Mai Ho-Dac, CLLE-ERSS, Université Toulouse le Mirail
Nathalie Souf, IRIT-ELIPSE, Université Paul Sabatier et ISIS Castres
Mustapha Mojahid, IRIT-ELIPSE, Université Paul Sabatier
Durée : 5-6 mois.
Rémunération : celle prévue par la règlementation à savoir 436,05 EUR
par mois.
Début : à partir de Mars-Avril 2014.
*Profil du candidat *
Le candidat devra être inscrit dans un Master 2 en traitement
automatique des langues.
*Compétences demandées*
- compétences en traitement automatique des langues et/ou en
linguistique de corpus.
- compétences de base en informatique et idéalement maîtrise d'outils
pour l'analyse de corpus et/ou de langages de programmation de type
perl et python.
*Comment candidater ?*
Envoyer un CV (avec le détail des cours et notes des deux années de
Master) et une lettre de motivation à : Mustapha.Mojahid at irit.fr
-------------------------------------------------------------------------
Message diffuse par la liste Langage Naturel <LN at cines.fr>
Informations, abonnement : http://www.atala.org/article.php3?id_article=48
English version :
Archives : http://listserv.linguistlist.org/archives/ln.html
http://liste.cines.fr/info/ln
La liste LN est parrainee par l'ATALA (Association pour le Traitement
Automatique des Langues)
Information et adhesion : http://www.atala.org/
ATALA décline toute responsabilité concernant le contenu des
messages diffusés sur la liste LN
-------------------------------------------------------------------------
More information about the Ln
mailing list