Livre: Ce qui compte. Methodes statistiques - Ecrits choisis, tome II.
Thierry Hamon
thierry.hamon at UNIV-PARIS13.FR
Wed Jun 8 20:42:46 UTC 2011
Date: Mon, 6 Jun 2011 23:20:22 +0200
From: Céline Poudat <celine at poudat.fr>
Message-ID: <BANLkTimMP1_Ayn3CeHauu-sK+Trmd-Yd4w at mail.gmail.com>
Livre: Ce qui compte. Méthodes statistiques - Écrits choisis, tome II.
Chers/chères collègues,
J'ai le plaisir de vous annoncer la parution de l'ouvrage:
Étienne Brunet - Ce qui compte. Écrits choisis, tome II. Méthodes
statistiques
Paris, Champion, 2011. 376 pages. ISBN 9782745322258.
Collection Lettres numériques.
Textes édités par Céline Poudat; préface de Ludovic Lebart.
------------------------------------------------------------------------
Ce volume recueille une sélection de dix-sept textes d’Étienne Brunet
abordant les questions statistiques et informatiques pertinentes pour
le traitement linguistique de corpus.
Organisées chronologiquement, ces études parcourent quarante années
d’une recherche qui explore sans relâche les rapports entre
statistique et linguistique. Elles vont de l’évaluation des mesures à
l’annotation et à la lemmatisation des corpus textuels. Ainsi voit-on,
au fil des débats qui ont marqué ces disciplines, se structurer les
champs de la lexicométrie et de la linguistique de corpus.
Exposées et illustrées avec clarté, les méthodes présentées pourront
être exploitées avec le logiciel HYPERBASE, installé sur le DVD de
corpus littéraires annexé à ce volume.
Préfacé par Ludovic Lebart, cet ouvrage est ainsi un indispensable
guide méthodologique et permet de répondre aux questions que posent
aujourd’hui l’analyse de données textuelles et la linguistique de
corpus.
------------------------------------------------------------------------
Table des matières
Avant-propos
Préface, par Ludovic Lebart
1. Programme
2. Introduction
3. L’analyse statistique du Trésor de la Langue Française
4. Loi hypergéométrique et loi normale.
Comparaison dans les grands corpus
5. Le viol de l’urne
6. La théorie de l’information vingt ans après Guiraud
7. Web et la statistique. L’exemple du mot Rome
8. Les liens hypertextuels ou Abondance de liens ne nuit pas
9. Qui lemmatise dilemme attise
10. La base textuelle Batelier
11. Formalisation et quantification des textes.
Le domaine français
12. Où l’on mesure la distance entre les distances
13. Navigation dans les rafales
14. Le corpus conçu comme une boule
15. Les séquences (suite)
16. Plaidoyer pour la statistique linguistique
17. Muller le lexicomaître
Index analytique
Annexes
Table des matières
Bien à vous,
Céline Poudat
-------------------------------------------------------------------------
Message diffuse par la liste Langage Naturel <LN at cines.fr>
Informations, abonnement : http://www.atala.org/article.php3?id_article=48
English version :
Archives : http://listserv.linguistlist.org/archives/ln.html
http://liste.cines.fr/info/ln
La liste LN est parrainee par l'ATALA (Association pour le Traitement
Automatique des Langues)
Information et adhesion : http://www.atala.org/
-------------------------------------------------------------------------
More information about the Ln
mailing list