These: Alejandro Molina, Compression automatique de phrases : un etude vers la generation de resumes

Thierry Hamon thierry.hamon at UNIV-PARIS13.FR
Fri Sep 27 19:19:41 UTC 2013


Date: Thu, 26 Sep 2013 17:26:15 +0200
From: Juan-Manuel Torres <juan-manuel.torres at univ-avignon.fr>
Message-ID: <52445217.3020809 at univ-avignon.fr>


La soutenance de thèse d'Alejandro MOLINA intitulée "Compression
automatique de phrases : un étude vers la génération de résumés" aura
lieu le lundi 30 Septembre 2013 à 14h30 dans la salle des thèses de
l'Université d'Avignon etd es Pays de Vaucluse à St. Marthe.


========Résumé========

Cette étude présente une nouvelle approche pour la génération
automatique de résumés, un des principaux défis du Traitement de la
Langue Naturelle. Ce sujet, traité pendant un demi-siècle par la
recherche, reste encore actuel car personne n'a encore réussi à créer
automatiquement des résumés comparables, en qualité, avec ceux produits
par des humains.
C'est dans ce contexte que la recherche en résumé automatique s'est 
divisée en deux grandes catégories : le résumé par extraction et le 
résumé par abstraction. Dans le premier, les phrases sont triées de 
façon à ce que les meilleures conforment le résumé final.
Or, les phrases sélectionnées pour le résumé portent souvent des 
informations secondaires, une analyse plus fine s'avère nécessaire.
Nous proposons une méthode de compression automatique de phrases basée 
sur l'élimination de fragments à l'intérieur de celles-ci.
A partir d'un corpus annoté, nous avons créé un modèle linéaire pour
prédire la suppression de ces fragments en fonction de caractéristiques
simples. Notre méthode prend en compte trois principes : celui de la
pertinence du contenu, l'informativité; celui de la qualité du contenu,
la grammaticalité, et la longueur, le taux de compression. Pour mesurer
l'informativité des fragments, nous utilisons une technique inspirée de
la physique statistique : l'énergie textuelle. Quant à la
grammaticalité, nous proposons d'utiliser des modèles de langage
probabilistes.
La méthode proposée est capable de générer des résumés corrects en
espagnol.  Les résultats de cette étude soulèvent divers aspects
intéressants vis-à- vis du résumé de textes par compression de phrases.
On a observé qu'en général il y a un haut degré de subjectivité de la
tâche. Il n'y a pas de compression optimale unique mais plusieurs
compressions correctes possibles. Nous considérons donc que les
résultats de cette étude ouvrent la discussion par rapport à la
subjectivité de l'informativité et son influence pour le résumé
automatique.

-------------------------------------------------------------------------
Message diffuse par la liste Langage Naturel <LN at cines.fr>
Informations, abonnement : http://www.atala.org/article.php3?id_article=48
English version       : 
Archives                 : http://listserv.linguistlist.org/archives/ln.html
                                http://liste.cines.fr/info/ln

La liste LN est parrainee par l'ATALA (Association pour le Traitement
Automatique des Langues)
Information et adhesion  : http://www.atala.org/

ATALA décline toute responsabilité concernant le contenu des
messages diffusés sur la liste LN
-------------------------------------------------------------------------



More information about the Ln mailing list