Q: Indexation de bases documentaires non structurees

Pierre Zweigenbaum pz at biomath.jussieu.fr
Tue Nov 16 16:57:12 UTC 1999


[Cette question relève surtout de la recherche d'information, mais les
 fonctionnalités d'indexation utilisant des outils de traitement
 automatique des langues peuvent être mieux connus du public de cette
 liste -- pz]


Date: Tue, 16 Nov 1999 16:01:44 +0100
From: Marie-Helene Antoni <Marie-Helene.Antoni at mshs.univ-poitiers.fr>
Message-Id: <199911161457.PAA23198 at melusine.mshs.univ-poitiers.fr>


Les outils de valorisation et d'exploitation de l'information se
multiplient sans cesse, et la plupart se situent en aval de la constitution
des fonds documentaires.
D'autres outils permettent le constitution rapide de gros fonds
documentaires, multi sources et multi formats.
Comment se fait le lien entre les deux ? autrement dit, quels sont les
outils permettant l'indexation de Bases documentaires non structurées?

Quels outils, comparables à Altavista Discovery, Verity Search,
travaillant sur des fichiers simplement enregistrés dans une arborescence,
mettons sur un seul disque, sont aujourd'hui disponibles, et avec quelles
fonctionnalités ?

 - indexation de tous types de formats (lesquels : textes, images, TTX,
BD,...),
 - sensibilité ou pas au déplacement des fichiers,
 - mise à jour automatique incrémentale des index,
 - outils d'interrogation sur la base constituée : recherche sur
chaîne de caractères, recherche booléenne, reformulation linguistique ...
 - outil d'exploitation de la réponse : traitement statistiques,
linguistiques ?

Y a-t-il des logiciels commerciaux, des logiciels libres (freeware), des
versions beta ?
qui tournent dans quels environnements et sur quels volumes etc ...?



More information about the Ln mailing list