Livre: Experimentations et evaluations en fouille de textes

Thierry Hamon thierry.hamon at UNIV-PARIS13.FR
Sat Dec 1 20:30:07 UTC 2012


Date: Fri, 30 Nov 2012 16:05:51 +0100
From: "Ars" <ars at lavoisier.fr>
Message-ID: <008d01cdcf0c$38e71d40$aab557c0$@fr>

Expérimentations et évaluations en fouille de textes

un panorama des campagnes DEFT

Collection Systèmes d'information et organisations documentaires, sous
la direction de Stéphane Chaudiron

sous la direction de Cyril Grouin - Dominic Forest

La fouille de textes est une activité combinant traitements
informatiques et données linguistiques avec comme objectif principal
l’extraction et l’organisation automatique des informations présentes
dans les textes. Deux familles de méthodes permettent d’atteindre ce but
: celles à base de connaissances d’experts et celles reposant sur un
apprentissage automatique supervisé.

Une campagne d’évaluation consiste à confronter les systèmes développés
par plusieurs équipes sur un même jeu de données et en un temps
limité. Créé en 2005 à l’image des campagnes anglo-saxonnes, le défi
fouille de textes (DEFT) est aujourd’hui la seule campagne d’évaluation
francophone en fouille de textes.

Cet ouvrage rassemble les méthodes utilisées lors des différentes
éditions du défi. Les thématiques relèvent de la classification de
documents en genres et thèmes, de la fouille d’opinions et de
l’identification de la période de parution d’un document.

Les coordonnateurs  

Ingénieur d’Etudes CNRS au LIMSI, Cyril Grouin travaille sur
l’anonymisation de documents cliniques et sur les entités nommées
étendues. Il coorganise les campagnes d’évaluation DEFT sur la fouille
de textes. 

Dominic Forest est professeur agrégé à l’Ecole de bibliothéconomie et
des sciences de l’information de l’Université de Montréal. Ses
recherches portent sur la fouille de textes et les humanités
numériques. 

Nous vous remercions de l'accueil que vous réserverez à cet ouvrage et
espérons qu'il suscitera l'intérêt de vos lecteurs.

Pour information :
ISBN : 978-2-7462-3836-7 - Format : 15,5 x 23,5 - 248  p. - 59 €
Éditeur : Hermes - Lavoisier
Vous pouvez vous procurer cet ouvrage dans toutes les librairies
spécialisées et sur le site Lavoisier : www.lavoisier.fr

Expérimentations et évaluations
en fouille de textes

un panorama des campagnes DEFT

Sommaire :

Première partie - Introduction 

Chapitre 1. Expérimentations et évaluations en fouille de textes : un
            panorama des campagnes DEFT

Deuxième partie - Les campagnes en genres et thèmes

Chapitre 2. Détecter les ruptures thématiques dans les discours :
            synergie entre supervision et non- supervision

Chapitre 3. L’équipe du GRDS au DEFT2006 : Indexo-II

Chapitre 4. Pré-traitements classiques ou par analyse distributionnelle
            : application aux méthodes de classification automatique
            déployées pour DEFT2008

Troisième partie - Les campagnes en fouille d’opinions 

Chapitre 5. Classification d’opinions et convergence des techniques
            symboliques, statistiques et distributionnelles

Chapitre 6. DEFT2009 : essais d’optimisation d’une procédure de base
            pour la tâche 1

Chapitre 7. Détection de la subjectivité et catégorisation de textes
            subjectifs par une approche mixte symbolique et statistique

Quatrième partie - Les campagnes diachroniques 

Chapitre 8. Datation d’un article de journal par analyse lexicale et
            statistique

Chapitre 9. Système du LIA pour la campagne DEFT2010 

Chapitre 10. Apprentissage supervisé et paresseux pour la fouille de
             textes

Chapitre 11. Méthodes pour l’archéologie linguistique : datation par
             combinaison d’indices temporels

Index 

-------------------------------------------------------------------------
Message diffuse par la liste Langage Naturel <LN at cines.fr>
Informations, abonnement : http://www.atala.org/article.php3?id_article=48
English version       : 
Archives                 : http://listserv.linguistlist.org/archives/ln.html
                                http://liste.cines.fr/info/ln

La liste LN est parrainee par l'ATALA (Association pour le Traitement
Automatique des Langues)
Information et adhesion  : http://www.atala.org/
-------------------------------------------------------------------------



More information about the Ln mailing list