Ressource: Fran=?ISO-8859-1?Q?=E7ais_?=parle, une nouvelle ressource pour l'annotation automatique en POS
Thierry Hamon
thierry.hamon at UNIV-PARIS13.FR
Tue Jul 3 20:21:26 UTC 2012
Date: Mon, 02 Jul 2012 11:41:12 +0200
From: Christophe Benzitoun <Christophe.Benzitoun at univ-nancy2.fr>
Message-ID: <4FF16CB8.7060208 at univ-nancy2.fr>
X-url: http://cnrtl.fr/corpus/perceo/
X-url: http://cnrtl.fr/corpus/tcof/
Bonjour,
Une nouvelle ressource basée sur du français parlé est disponible à
l'adresse suivante : http://cnrtl.fr/corpus/perceo/
Elle est composée :
- de transcriptions annotés automatiquement et corrigées manuellement au
format Treetagger => une unité par ligne décomposée comme suit : mot
puis POS puis lemme, le tout séparé par des tabulations. Cette
ressource fait un peu plus de 100.000 mots et elle s'appuie sur le
corpus TCOF, également disponible à l'adresse :
http://cnrtl.fr/corpus/tcof/
- d'un lexique composé pour une part de Morphalou 2.0 (ressource
exogène) et pour une autre du corpus annoté lui-même (ressource
endogène).
- d'un fichier paramètre à utiliser avec Treetagger.
L'intégralité de ces fichiers (encodés en utf-8) sont utilisables
librement pour des applications non commerciales. A noter que la
ressource ne pouvant pas être exempte d'erreurs, les futurs utilisateurs
pourront envoyer leurs relevés afin de l'améliorer.
Cordialement,
Christophe Benzitoun, Maître de conférences à l'Université de Lorraine
Membre élu au Conseil d'Administration
UFR Sciences du langage
Membre de l'ATILF - Université de Lorraine & CNRS
44, avenue de la Libération
BP 30687
54063 Nancy cedex
tel : 03 54 50 53 40
e-mail : Christophe.Benzitoun at univ-lorraine.fr
-------------------------------------------------------------------------
Message diffuse par la liste Langage Naturel <LN at cines.fr>
Informations, abonnement : http://www.atala.org/article.php3?id_article=48
English version :
Archives : http://listserv.linguistlist.org/archives/ln.html
http://liste.cines.fr/info/ln
La liste LN est parrainee par l'ATALA (Association pour le Traitement
Automatique des Langues)
Information et adhesion : http://www.atala.org/
-------------------------------------------------------------------------
More information about the Ln
mailing list