Seminaire: Exploration textometrique des thematiques dans un corpus, 13 fevrier 2014, Universite de Paris Est Marne la Vallee

Thierry Hamon hamon at LIMSI.FR
Sat Feb 8 11:13:20 UTC 2014


Date: Thu, 06 Feb 2014 16:12:20 +0100
From: Nicolas Turenne <nturenne.inra at yahoo.fr>
Message-ID: <52F3A654.3000909 at yahoo.fr>
X-url: http://www.inra-ifris.org/axes-de-recherche-thematique/groupe-plateforme-cortext/seminaire-de-l-axe-traces-digitales-groupe-cortext.html


[désolé pour les réceptions multiples]

Chers collègues,

Dans le cadre de la quinzième séance du séminaire 'traces digitales' du
groupe CorText, nous avons le plaisir d'accueillir Philippe Gambette
(MCF, Université Paris-Est Marne la Vallée) et Mathieu Brugidou
(chercheur HDR, EDF) qui nous parleront d’analyse statistique de données
textuelles.
Cette matinée aura lieu le jeudi 13 février de 10h à 13h00, dans la
salle de réunion C219 du Latts (Université Paris-Est Marne la Vallée -
rue Galilée, bâtiment du Bois de l’Etang - 2ème étage - aile C). Voir
http://www.inra-ifris.org/axes-de-recherche-thematique/groupe-plateforme-cortext/seminaire-de-l-axe-traces-digitales-groupe-cortext.html


10h-11h30 Philippe Gambette (maître de conférences, LIGM, Université
Paris-Est Marne-la-Vallée)

Exploration textométrique des thématiques dans un corpus de projets de
recherche sur la biodiversité

Résumé : À partir d’un corpus de plus de 4000 résumés de projets
financés par une quinzaine d’agences de divers pays européens, nous
dressons un panorama des tendances temporelles et géographiques de la
recherche sur la biodiversité financée en Europe entre 2004 et 2011.
Pour cela, analyses factorielles, évaluations de spécificités de
vocabulaire et visualisations en nuages arborés sont combinées dans le
cadre d’une analyse exploratoire enrichie par le regard d’un expert du
domaine. Les qualités et les limites de la visualisation en nuage arboré
seront tout particulièrement évoquées, et approfondies par d’autres cas
d’utilisation.

11h30-13h Mathieu Brugidou (chercheur HDR, EDF)

Le Grenelle de l’environnement : une approche morphologique et formelle
avec des logiciels d’analyse des données textuelles, Alceste et Tropes.

Résumé : L’hypothèse privilégiée dans ce travail est de considérer le
Grenelle de l’environnement comme un dispositif d’écriture collective.
Il ne s’agit pas seulement d’un dispositif de participation et de
concertation des parties prenantes, marqué fortement par une dimension
de négociation, comme l’indique la reprise du terme de Grenelle. Ce
processus de concertation s’avère être aussi un dispositif d’écriture
collective destiné à produire des synthèses et des mesures d’action
publique. Deux types d’approches seront privilégiés dans cette analyse.
Une première approche, morphologique, est orientée vers l’analyse de la
représentation des problèmes ; une seconde, formelle, [Lassegue, 2010]
est dédiée à l’analyse de la formulation de mesures :

  La perspective morphologique cherche à mettre en évidence les
  structures thématiques des différents corpus et leurs dynamiques. Nous
  faisons l’hypothèse que le dispositif du Grenelle – et notamment sa
  conception en phases – produit des cartographies des problèmes et que
  ceux-ci ne peuvent être représentés que de manière relationnelle. La
  définition des problèmes pour les acteurs du Grenelle implique de
  trier les questions, d’abord entre celles qui relèvent ou qui ne
  relèvent pas du Grenelle de l’environnement, ensuite entre celles
  définissant les différents problèmes identifiés au cours du
  Grenelle. Les méthodes d’analyses des données textuelles seront ici
  privilégiées – notamment celles s’inscrivant dans la filiation de
  Benzécri, à l’image de la méthode Alceste développée par M.Reinert,
  tournées vers une approche empirique des structures ;

  Une deuxième perspective peut être qualifiée de formelle dans la
  mesure où elle s’attache aux effets des dispositifs d’écritures sur la
  forme des mesures. Il s’agit de décrire la mise en forme des mesures
  en faisant l’hypothèse que celles-ci – au-delà de leurs contenus –
  présentent des caractéristiques linguistiques propres qui répondent à
  une grammaire [Lemieux, 2009] qui définit leurs propriétés
  pragmatiques.  Cette deuxième approche, plus analytique, privilégie
  des études diachroniques suivant le phasage du dispositif. Ce sont
  notamment des analyses morphosyntaxiques qui seront ici conduites avec
  l’aide du logiciel Tropes. Ces analyses seront conduites sur des
  corpus construits selon différents paramètres de temps (les phases de
  la négociation) mais aussi d’espaces de discours (les différents
  dispositifs d’écritures, lesquels renvoient aux phases du Grenelle
  mais aussi à des sous espaces des rapports, par exemple l’opposition
  entre synthèse et annexes, etc.).

-------------------------------------------------------------------------
Message diffuse par la liste Langage Naturel <LN at cines.fr>
Informations, abonnement : http://www.atala.org/article.php3?id_article=48
English version       : 
Archives                 : http://listserv.linguistlist.org/archives/ln.html
                                http://liste.cines.fr/info/ln

La liste LN est parrainee par l'ATALA (Association pour le Traitement
Automatique des Langues)
Information et adhesion  : http://www.atala.org/

ATALA décline toute responsabilité concernant le contenu des
messages diffusés sur la liste LN
-------------------------------------------------------------------------



More information about the Ln mailing list