Soft: ProLMF 1.2, une ressource libre de noms propres et derives

Thierry Hamon thierry.hamon at UNIV-PARIS13.FR
Sun Apr 14 09:47:10 UTC 2013


Date: Wed, 10 Apr 2013 15:12:31 +0200 (CEST)
From: Denis Maurel <denis.maurel at univ-tours.fr>
Message-ID: <1614346207.3259166.1365599551560.JavaMail.root at mail10>
X-url: http://www.cnrtl.fr/lexiques/prolex/


ProLMF est une ressource libre de noms propres, au format d'échange LMF
(Lexical Markup Framework), qui a la particularité de rassembler des
noms propres, en s'intéressant aussi à la morphologie flexionnelle et
dérivationnelle de ces noms. Cette ressource est présentée et
téléchargeable sur le site du CNRTL (Centre national de ressources
textuelles et lexicales). Elle est issue du projet Prolex du Laboratoire
d'informatique de l'université François-Rabelais de Tours et, plus
particulièrement, de la base de données Prolexbase.

La version 1.2 corrige quelques erreurs de la version 1.1, contient des
entrées supplémentaires (en particulier grâce à des règles
d'aliasisation) et propose des nouveautés: quelques petits lexiques en
d'autres langues que le français et, en français, une indication sur la
présence ou non des articles et sur la préposition locative précédant
les noms de pays, ainsi que des schémas lexicaux de contextualisation,
concernant, soit le nom propre seul (Paris/la ville de Paris), soit le
nom propre en relation d'accessibilité avec un autre nom propre (Paris,
la capitale de la France).

En résumé, ProLMF 1.2 comporte : 
– un lexique français avec lemme, forme et sens pour chaque entrée
  lexicale, ainsi que des schémas de contextualisation ; 
– quelques petits lexiques (allemand, anglais, italien, néerlandais,
  polonais, portugais et serbe) avec uniquement lemme et sens ; 
– et une description au niveau multilingue avec des informations
  typologiques et, surtout, des relations entre noms propres (synonymie,
  méronymie et accessibilité).

Quelques chiffres: 
Nombre de langues : 8 
Nombre d'entrées lexicales en français : 73 029 
Nombre de pivots : 55 250 
Nombre de relations : 53 347 (2 977 accessibilités, 49 699 méronymies et
                              671 synonymies) 
Nombre de lemmes : 75 368 
Nombre de formes fléchies : 123 859 (78 449 noms, 9 543 adjectifs et 219
                                     préfixes) 

Denis MAUREL et Béatrice BOUCHOU

-------------------------------------------------------------------------
Message diffuse par la liste Langage Naturel <LN at cines.fr>
Informations, abonnement : http://www.atala.org/article.php3?id_article=48
English version       : 
Archives                 : http://listserv.linguistlist.org/archives/ln.html
                                http://liste.cines.fr/info/ln

La liste LN est parrainee par l'ATALA (Association pour le Traitement
Automatique des Langues)
Information et adhesion  : http://www.atala.org/
-------------------------------------------------------------------------



More information about the Ln mailing list