Livre: Experimentations et evaluations en fouille de textes
Thierry Hamon
thierry.hamon at UNIV-PARIS13.FR
Sat Dec 1 20:30:07 UTC 2012
Date: Fri, 30 Nov 2012 16:05:51 +0100
From: "Ars" <ars at lavoisier.fr>
Message-ID: <008d01cdcf0c$38e71d40$aab557c0$@fr>
Expérimentations et évaluations en fouille de textes
un panorama des campagnes DEFT
Collection Systèmes d'information et organisations documentaires, sous
la direction de Stéphane Chaudiron
sous la direction de Cyril Grouin - Dominic Forest
La fouille de textes est une activité combinant traitements
informatiques et données linguistiques avec comme objectif principal
l’extraction et l’organisation automatique des informations présentes
dans les textes. Deux familles de méthodes permettent d’atteindre ce but
: celles à base de connaissances d’experts et celles reposant sur un
apprentissage automatique supervisé.
Une campagne d’évaluation consiste à confronter les systèmes développés
par plusieurs équipes sur un même jeu de données et en un temps
limité. Créé en 2005 à l’image des campagnes anglo-saxonnes, le défi
fouille de textes (DEFT) est aujourd’hui la seule campagne d’évaluation
francophone en fouille de textes.
Cet ouvrage rassemble les méthodes utilisées lors des différentes
éditions du défi. Les thématiques relèvent de la classification de
documents en genres et thèmes, de la fouille d’opinions et de
l’identification de la période de parution d’un document.
Les coordonnateurs
Ingénieur d’Etudes CNRS au LIMSI, Cyril Grouin travaille sur
l’anonymisation de documents cliniques et sur les entités nommées
étendues. Il coorganise les campagnes d’évaluation DEFT sur la fouille
de textes.
Dominic Forest est professeur agrégé à l’Ecole de bibliothéconomie et
des sciences de l’information de l’Université de Montréal. Ses
recherches portent sur la fouille de textes et les humanités
numériques.
Nous vous remercions de l'accueil que vous réserverez à cet ouvrage et
espérons qu'il suscitera l'intérêt de vos lecteurs.
Pour information :
ISBN : 978-2-7462-3836-7 - Format : 15,5 x 23,5 - 248 p. - 59 €
Éditeur : Hermes - Lavoisier
Vous pouvez vous procurer cet ouvrage dans toutes les librairies
spécialisées et sur le site Lavoisier : www.lavoisier.fr
Expérimentations et évaluations
en fouille de textes
un panorama des campagnes DEFT
Sommaire :
Première partie - Introduction
Chapitre 1. Expérimentations et évaluations en fouille de textes : un
panorama des campagnes DEFT
Deuxième partie - Les campagnes en genres et thèmes
Chapitre 2. Détecter les ruptures thématiques dans les discours :
synergie entre supervision et non- supervision
Chapitre 3. L’équipe du GRDS au DEFT2006 : Indexo-II
Chapitre 4. Pré-traitements classiques ou par analyse distributionnelle
: application aux méthodes de classification automatique
déployées pour DEFT2008
Troisième partie - Les campagnes en fouille d’opinions
Chapitre 5. Classification d’opinions et convergence des techniques
symboliques, statistiques et distributionnelles
Chapitre 6. DEFT2009 : essais d’optimisation d’une procédure de base
pour la tâche 1
Chapitre 7. Détection de la subjectivité et catégorisation de textes
subjectifs par une approche mixte symbolique et statistique
Quatrième partie - Les campagnes diachroniques
Chapitre 8. Datation d’un article de journal par analyse lexicale et
statistique
Chapitre 9. Système du LIA pour la campagne DEFT2010
Chapitre 10. Apprentissage supervisé et paresseux pour la fouille de
textes
Chapitre 11. Méthodes pour l’archéologie linguistique : datation par
combinaison d’indices temporels
Index
-------------------------------------------------------------------------
Message diffuse par la liste Langage Naturel <LN at cines.fr>
Informations, abonnement : http://www.atala.org/article.php3?id_article=48
English version :
Archives : http://listserv.linguistlist.org/archives/ln.html
http://liste.cines.fr/info/ln
La liste LN est parrainee par l'ATALA (Association pour le Traitement
Automatique des Langues)
Information et adhesion : http://www.atala.org/
-------------------------------------------------------------------------
More information about the Ln
mailing list