Q: Identification de la langue en LN ecrit

Pierre Zweigenbaum pz at biomath.jussieu.fr
Tue Mar 21 16:18:41 UTC 2000


Date: Tue, 21 Mar 2000 16:47:16 +0100
From: "laurent charnay" <laurent.charnay at arisem.com>
Message-Id: <000901bf934c$bc775d00$5700000a at ARISEM>


bonjour,

une des methodes pour identifier la langue d'un document ecrit
se fonde sur les trigrammes, i.e. sur les frequences statistiques
d'occurence
de sequences de 3 caracteres, caracteristiques d'une langue.
Je cherche les tables de frequence caracteristiques des principales langues
europeennes (Francais, Anglais, Allemand, Espagnol, Italien...)
et eventuellement un logiciel libre qui les mettrait en oeuvre...
merci d'avance

bien cordialement

----------------------------------------------
Laurent Charnay                         ARISEM
laurent.charnay at arisem.com      01 44 88 99 66
----------------------------------------------

[le message d'origine contenait également l'info suivante : -- pz]

 Par ailleurs, j'ai mis en ligne une partie de ma these qui contient
 un etat de l'art et une biblio sur le Dialogue Homme-machine et sur
 la problematique Explication dans les systemes experts. Ceci peut
 interesser des doctorants dans ces domaines :
 http://www.limsi.fr/Individu/charnay/WWW/thIndex.htm

___________________________________________________________________
Message diffusé par la liste Langage Naturel <LN at cines.fr>
Informations, abonnement : http://www.biomath.jussieu.fr/LN/LN-F/
English version          : http://www.biomath.jussieu.fr/LN/LN/
Archives                 : http://web-lli.univ-paris13.fr/ln/



More information about the Ln mailing list