These: Florian Boudian, Resume automatique de texte

Thierry Hamon thierry.hamon at LIPN.UNIV-PARIS13.FR
Fri Nov 28 15:54:28 UTC 2008


Date: Fri, 28 Nov 2008 15:06:31 +0100
From: Juan Manuel Torres Moreno <juan-manuel.torres at univ-avignon.fr>
Message-ID: <492FFAE7.4040608 at univ-avignon.fr>


Bonjour,

J'ai le plaisir de vous annoncer la soutenance de thèse en
informatique de Florian BOUDIN au Laboratoire Informatique d'Avignon
(LIA). Elle porte sur les approches statistiques pour le résumé
automatique de texte. La thèse aura lieu le vendredi 5 décembre 2008 à
13h30, dans l'amphi Pascal de l'IUP UAPV/Avignon (Site Agroparc).

Vous êtes cordialement invités.

-- 
Juan Manuel TORRES-MORENO
Responsable de la thématique TALNE LIA/Université d'Avignon  
Laboratoire Informatique d'Avignon 
BP 1228, 84911 Avignon Cedex 9, FRANCE
Tél: (+33) 04 90 84 35 68
fax: (+33) 04 90 84 35 01



 =======================================================================
Titre: Exploration d'approches statistiques pour le résumé automatique
de texte

Résumé:

Un résumé est un texte reformulé dans un espace plus réduit. Il doit
exprimer avec un minimum de mots le contenu essentiel d'un
document. Son but est d'aider le lecteur à repérer les informations
qui peuvent l'intéresser sans pour autant devoir lire le document en
entier. Mais pourquoi avons-nous tant besoin de résumés? Simplement
parce que nous ne disposons pas d’assez de temps et d’énergie pour
tout lire. La masse d'information textuelle sous forme électronique ne
cesse d'augmenter, que ce soit sur Internet ou dans les réseaux des
entreprises. Ce volume croissant de textes disponibles rend difficile
l'accès à l'information désirée sans l'aide d'outils
spécifiques. Produire un résumé est une tâche très complexe car elle
nécessite des connaissances linguistiques ainsi que des connaissances
du monde qui restent très difficiles à incorporer dans un système
automatique. Dans cette thèse de doctorat, nous explorons la
problématique du résumé automatique par le biais de trois méthodes
statistiques permettant chacune la production de résumés répondant à
une tâche différente.

Nous proposons une première approche pour la production de résumé dans
le domaine spécialisé de la Chimie Organique. Un prototype nommé Yachs
a été développé pour démontrer la viabilité de notre approche. Ce
système est composé de deux modules, le premier applique un
pré-traitement linguistique particulier afin de tenir compte de la
spécificité des documents de Chimie Organique tandis que le second
sélectionne et assemble les phrases à partir de critères statistiques
dont certains sont spécifiques au domaine. Nous proposons ensuite une
approche répondant à la problématique du résumé automatique
multi-documents orienté par une thématique. Nous détaillons les
adaptations apportées au système de résumé générique Cortex ainsi que
les résultats observés sur les données des campagnes d’évaluation
DUC. Les résultats obtenus par la soumission du LIA lors des
participations aux campagnes d'évaluations DUC 2006 et DUC 2007 sont
discutés. Nous proposons finalement deux méthodes pour la génération
de résumés mis-à-jour. La première approche dite de
maximisation-minimisation a été évaluée par une participation à la
tâche pilote de DUC 2007. La seconde méthode est inspirée de Maximal
Marginal Relevance (MMR), elle a été évaluée par plusieurs soumissions
lors de la campagne TAC 2008.

Mots clés:
Traitement Automatique du Langage Naturel, Résumé Automatique,
Méthodes Statistiques, Chimie Organique, Maximal Marginal Relevance,
Document Understanding Conference, Text Analysis Conference.
=======================================

-------------------------------------------------------------------------
Message diffuse par la liste Langage Naturel <LN at cines.fr>
Informations, abonnement : http://www.atala.org/article.php3?id_article=48
English version       : 
Archives                 : http://listserv.linguistlist.org/archives/ln.html
                                http://liste.cines.fr/info/ln

La liste LN est parrainee par l'ATALA (Association pour le Traitement
Automatique des Langues)
Information et adhesion  : http://www.atala.org/
-------------------------------------------------------------------------



More information about the Ln mailing list