Nueva versión en la red del 'Corpus del =?iso-8859-1?Q?Espa=F1ol=27?=: http://www.corpusdelespanol.org

Carlos Subirats subirats at ICSI.BERKELEY.EDU
Fri Feb 14 01:05:18 UTC 2003


INFOLING. Lista moderada de lingüística española (ISSN: 1576-3404)
                 http://elies.rediris.es/infoling/
                   Repetidor (mirror) en EE.UU:
      http://listserv.linguistlist.org/archives/infoling.html
     Envío de información: infoling-request at listserv.rediris.es
                             EDITORES:
      Carlos Subirats Rüggeberg <subirats at icsi.berkeley.edu>
          Mar Cruz Piñol, U. Barcelona <mcruz at fil.ub.es>
       Eulalia de Bobes Soler, UAB <Eulalia.deBobes at uab.es>
                        EQUIPO DE EDICIÓN:
         http://elies.rediris.es/infoling/editores.html
La lista de distribución Infoling está asociada a la red temática
ESTUDIOS DE LINGÜÍSTICA ESPAÑOLA http://elies.rediris.es
_________________________________________________________________

        Nueva versión en la red del 'Corpus del Español':
               http://www.corpusdelespanol.org
   Realizado bajo la dirección del Prof. Mark Davies, Illinois State
University (Illinois, EE.UU) con financiación del National Endowment for
the Humanities
_________________________________________________________________

   Esta nueva versión del Corpus del Español, a la que se puede acceder
desde:

              http://www.corpusdelespanol.org

integra una colección de más de 10.000 textos de los siglos XIII al XX.

   El Corpus del Español permite realizar nuevos tipos de búsquedas,
-que hasta ahora no era posible realizar con otros corpora del español
en la red-, como p. ej.:

- búsquedas de sinónimos para más de 30.000 palabras: p. ej.,
  cuáles son los sinónimos más comunes de 'inteligente', 'rico',
  etc.

- búsquedas de colocaciones, es decir, búsquedas de coocurrencias
  entre palabras, en función de su frecuencia, p. ej., cuáles son
  los adjetivos más comunes con 'cara', los sustantivos que
  concurren con más frecuencia después de 'suave', o los verbos más
  comunes con 'chistes';

- búsquedas de frecuencias, como p. ej., qué verbos nuevos han
  aparecido desde el siglo XIX, o qué sinónimos de 'roto' son más
  comunes en el español escrito que en el español hablado;

  - búsqueda de frecuencias en función de:

    - la categoría gramatical, p. ej., los infinitivos más comunes
      después de 'imposible de', o los adjetivos más comunes
      después de 'noche'
    - el lema, p. ej., la frecuencia de todas las formas verbales
      asociadas al lema 'decir', en el siglo XII, XVI o XX.

- búsquedas de palabras en función de sufijos, p. ej., las palabras
  que terminan en '-azo' o búsquedas en función de cadenas de
  caracteres internas, p. ej., las palabras que tienen la cadena
  '-camin-' en su interior;

- posibilidad de creación de listas de palabras personalizadas,
  así p. ej., se pueden crear listas de palabras relacionadas con
  las emociones, la ropa, etc., y después se pueden usar en otras
  búsquedas;

- búsquedas a partir de combinaciones de búsquedas más sencillas,
  p. ej., todas las formas de todos los sinónimos de 'decir',
  seguidas de todas las formas de todos los sinónimos de 'chiste'.


             Más información y acceso al corpus:
              http://www.corpusdelespanol.org


   El 'Corpus del Español' tiene un enlace permanente en la web de
Estudios de Lingüística Española http://elies.rediris.es , en la página
de 'Enlaces' y dentro de ella, en la sección de 'Corpus textuales y
bases de datos'

----------------------------------------------------
Web de INFOLING: http://elies.rediris.es/infoling/
------------------------------------------------------



More information about the Infoling mailing list