Soft: ProLMF 1.2, une ressource libre de noms propres et derives
Thierry Hamon
thierry.hamon at UNIV-PARIS13.FR
Sun Apr 14 09:47:10 UTC 2013
Date: Wed, 10 Apr 2013 15:12:31 +0200 (CEST)
From: Denis Maurel <denis.maurel at univ-tours.fr>
Message-ID: <1614346207.3259166.1365599551560.JavaMail.root at mail10>
X-url: http://www.cnrtl.fr/lexiques/prolex/
ProLMF est une ressource libre de noms propres, au format d'échange LMF
(Lexical Markup Framework), qui a la particularité de rassembler des
noms propres, en s'intéressant aussi à la morphologie flexionnelle et
dérivationnelle de ces noms. Cette ressource est présentée et
téléchargeable sur le site du CNRTL (Centre national de ressources
textuelles et lexicales). Elle est issue du projet Prolex du Laboratoire
d'informatique de l'université François-Rabelais de Tours et, plus
particulièrement, de la base de données Prolexbase.
La version 1.2 corrige quelques erreurs de la version 1.1, contient des
entrées supplémentaires (en particulier grâce à des règles
d'aliasisation) et propose des nouveautés: quelques petits lexiques en
d'autres langues que le français et, en français, une indication sur la
présence ou non des articles et sur la préposition locative précédant
les noms de pays, ainsi que des schémas lexicaux de contextualisation,
concernant, soit le nom propre seul (Paris/la ville de Paris), soit le
nom propre en relation d'accessibilité avec un autre nom propre (Paris,
la capitale de la France).
En résumé, ProLMF 1.2 comporte :
– un lexique français avec lemme, forme et sens pour chaque entrée
lexicale, ainsi que des schémas de contextualisation ;
– quelques petits lexiques (allemand, anglais, italien, néerlandais,
polonais, portugais et serbe) avec uniquement lemme et sens ;
– et une description au niveau multilingue avec des informations
typologiques et, surtout, des relations entre noms propres (synonymie,
méronymie et accessibilité).
Quelques chiffres:
Nombre de langues : 8
Nombre d'entrées lexicales en français : 73 029
Nombre de pivots : 55 250
Nombre de relations : 53 347 (2 977 accessibilités, 49 699 méronymies et
671 synonymies)
Nombre de lemmes : 75 368
Nombre de formes fléchies : 123 859 (78 449 noms, 9 543 adjectifs et 219
préfixes)
Denis MAUREL et Béatrice BOUCHOU
-------------------------------------------------------------------------
Message diffuse par la liste Langage Naturel <LN at cines.fr>
Informations, abonnement : http://www.atala.org/article.php3?id_article=48
English version :
Archives : http://listserv.linguistlist.org/archives/ln.html
http://liste.cines.fr/info/ln
La liste LN est parrainee par l'ATALA (Association pour le Traitement
Automatique des Langues)
Information et adhesion : http://www.atala.org/
-------------------------------------------------------------------------
More information about the Ln
mailing list