Q: Identification de la langue en LN ecrit
Pierre Zweigenbaum
pz at biomath.jussieu.fr
Tue Mar 21 16:18:41 UTC 2000
Date: Tue, 21 Mar 2000 16:47:16 +0100
From: "laurent charnay" <laurent.charnay at arisem.com>
Message-Id: <000901bf934c$bc775d00$5700000a at ARISEM>
bonjour,
une des methodes pour identifier la langue d'un document ecrit
se fonde sur les trigrammes, i.e. sur les frequences statistiques
d'occurence
de sequences de 3 caracteres, caracteristiques d'une langue.
Je cherche les tables de frequence caracteristiques des principales langues
europeennes (Francais, Anglais, Allemand, Espagnol, Italien...)
et eventuellement un logiciel libre qui les mettrait en oeuvre...
merci d'avance
bien cordialement
----------------------------------------------
Laurent Charnay ARISEM
laurent.charnay at arisem.com 01 44 88 99 66
----------------------------------------------
[le message d'origine contenait également l'info suivante : -- pz]
Par ailleurs, j'ai mis en ligne une partie de ma these qui contient
un etat de l'art et une biblio sur le Dialogue Homme-machine et sur
la problematique Explication dans les systemes experts. Ceci peut
interesser des doctorants dans ces domaines :
http://www.limsi.fr/Individu/charnay/WWW/thIndex.htm
___________________________________________________________________
Message diffusé par la liste Langage Naturel <LN at cines.fr>
Informations, abonnement : http://www.biomath.jussieu.fr/LN/LN-F/
English version : http://www.biomath.jussieu.fr/LN/LN/
Archives : http://web-lli.univ-paris13.fr/ln/
More information about the Ln
mailing list