These: Remi Lavalley, Extraction automatique de segments textuels, detection de roles, de sujets et de polarites

Fri Jul 6 19:40:47 UTC 2012

Date: Wed, 04 Jul 2012 20:38:46 +0200
From: Remi Lavalley <remi.lavalley at univ-avignon.fr>
Message-ID: <4FF48DB6.4040204 at univ-avignon.fr>

Bonjour,

j'ai le plaisir de vous inviter à la soutenance de ma thèse intitulée

"Extraction automatique de segments textuels, détection de rôles, de
sujets et de polarités"

effectuée dans le cadre d'un contrat CIFRE entre EDF et le LIA.

Celle-ci se tiendra le 9 juillet 2012 à 14h00 dans l'amphithéâtre Blaise
Pascal du Centre d'Enseignement et de Recherche en Informatique (CERI)
de l'Université d'Avignon et des Pays de Vaucluse (339, chemin des
Meinajaries-Agroparc BP 91228-84911 AVIGNON Cedex 9-FRANCE).

Vous êtes également les bienvenus au pot de thèse qui suivra la
soutenance.

Le jury sera composé de :
  M. Horacio Saggion, Professeur, DICT, Barcelone - Rapporteur
  M. Jacques Savoy, Professeur, IIUN, Neuchâtel - Rapporteur
  M. Mathieu Roche, Maître de Conférences HDR, LIRMM, Montpellier -
  Examinateur
  M. Patrice Bellot, Professeur, LSIS, Marseille - Directeur de thèse
  Mme Chloé Clavel, Ingénieur Chercheur, EDF R&D, Clamart - Directrice
  de thèse
  M. Marc El-Bèze, Professeur, LIA, Avignon - Directeur de thèse

Résumé :

Dans cette thèse, nous présentons de nouvelles méthodes permettant
l'extraction de chaînes de mots (segments textuels) relatives à des
catégories (thématiques, rôles des locuteurs, opinions). Nous proposons,
dans un premier temps, une méthode basée sur une métrique de recherche
de collocations, que nous appliquons de manière distincte sur les
documents liés à la même catégorie et qui, par itérations, nous permet
d'obtenir des chaînes caractéristiques de cette catégorie. Ces chaînes
sont alors employées pour améliorer les performances de systèmes de
catégorisation de textes ou dans un but d'extraction de connaissances
(faire ressortir des éléments textuels tels que des expressions
employées par un type de locuteurs, des sous-thématiques liées à la
catégorie, des jugements ou remarques fréquemment formulés, etc.).  Nous
proposons ensuite une seconde méthode permettant de rechercher, dans un
corpus d'opinions, des n-grammes exprimant des jugements sur des sujets
prédéfinis. Nous pouvons alors extraire des segments textuels
représentant l'expression d'une opinion sur un des sujets cibles.

Ces méthodes sont validées par un certain nombre d'expériences
effectuées dans des contextes différents : écrits de blogs,
transcriptions manuelles de parole spontanée, critiques de produits
culturels, enquêtes de satisfaction EDF, en français ou en anglais, ...

Bien cordialement,

Rémi Lavalley

-------------------------------------------------------------------------
Message diffuse par la liste Langage Naturel <LN at cines.fr>
Informations, abonnement : http://www.atala.org/article.php3?id_article=48
English version       : 
Archives                 : http://listserv.linguistlist.org/archives/ln.html
                                http://liste.cines.fr/info/ln

La liste LN est parrainee par l'ATALA (Association pour le Traitement
Automatique des Langues)
Information et adhesion  : http://www.atala.org/
-------------------------------------------------------------------------