Ressource: Les Voisins d'En Face

Thierry Hamon thierry.hamon at LIPN.UNIV-PARIS13.FR
Fri Jul 6 10:58:36 UTC 2007


Date: Fri, 06 Jul 2007 09:34:22 +0200
From: Franck Sajous <sajous at univ-tlse2.fr>
Message-ID: <468DF07E.5060103 at univ-tlse2.fr>
X-url: http://w3.univ-tlse2.fr/erss/
X-url: http://erss.irit.fr/voisinsdenface/
X-url: http://w3.univ-tlse2.fr/erss/voisinsdelemonde/
X-url: http://w3.univ-tlse2.fr/erss/textes/pagespersos/bourigault/syntex.html
X-url: http://www.cnrtl.fr/
X-url: http://w3.univ-tlse2.fr:8880/erss/index.jsp?perso=fsajous


Nous avons le plaisir de vous annoncer la mise en ligne de
l'application "Les Voisins d'En Face", réalisée au laboratoire
CLLE-ERSS (CNRS & Université Toulouse-Le Mirail :
http://w3.univ-tlse2.fr/erss/), par D.  Bourigault, Y. Chudy et
F. Sajous :

http://erss.irit.fr/voisinsdenface/

Les Voisins d'En Face est une application qui permet de comparer les
propriétés lexicales des mots du français (cooccurrents syntaxiques et
voisins distributionnels) sur deux corpus de 30 millions de mots
chacun :

    * un corpus journalistique comprenant l'ensemble des articles du
quotidien Le Monde sur la période de décembre 1999 à décembre 2000.
(Pour un accès à la base distributionnelle construite à partir de tous
les articles du Monde sur une période de 10 ans -200 millions de mots-
vous pouvez consulter les Voisins De Le Monde :
http://w3.univ-tlse2.fr/erss/voisinsdelemonde/.

    * un corpus littéraire de 515 romans du 20ème siècle issus de la
base Frantext.

Vous constaterez par exemple que les voisins du mot "révolution" sont :
    * "changement", dans le corpus journalistique (cooccurents 
syntaxiques : "opérer ~", "amorcer ~", "s'adapter à ~", etc.)
    * "attaque", "progrès", "miracle", "accident", "mariage", dans le 
corpus littéraire (cooccurents syntaxiques : "veille de ~", "croire à 
~", "préparer ~", "lendemain de ~", etc.)

Chaque corpus a été étiqueté morphosyntaxiquement à l'aide de l'outil
Treetagger, de l'Université de Stuttgart, puis analysé par l'analyseur
syntaxique Syntex
(http://w3.univ-tlse2.fr/erss/textes/pagespersos/bourigault/syntex.html),
développé par D. Bourigault au laboratoire CLLE-ERSS. L'analyse
distributionnelle a été réalisée par l'outil Upery développé par D.
Bourigault.

Cette application a été réalisée avec le soutien du CNRTL (Centre
National de Ressources Textuelles et Lexicales :
http://www.cnrtl.fr/).

N'hésitez pas à nous faire part de vos remarques et questions.

Didier Bourigault
Franck Sajous

-- 
Franck Sajous

CLLE-ERSS
Maison de la Recherche
Bureau B504
Université de Toulouse-Le Mirail
5, allées Antonio Machado
F - 31058 Toulouse Cedex 9

Tel. : +33 (0)5 61 50 25 61
Fax  : +33 (0)5 61 50 46 77

http://w3.univ-tlse2.fr:8880/erss/index.jsp?perso=fsajous


-------------------------------------------------------------------------
Message diffuse par la liste Langage Naturel <LN at cines.fr>
Informations, abonnement : http://www.atala.org/article.php3?id_article=48
English version       : 
Archives                 : http://listserv.linguistlist.org/archives/ln.html
                                http://liste.cines.fr/info/ln

La liste LN est parrainee par l'ATALA (Association pour le Traitement
Automatique des Langues)
Information et adhesion  : http://www.atala.org/
-------------------------------------------------------------------------



More information about the Ln mailing list