Nueva versión en la red del 'Corpus del =?iso-8859-1?Q?Espa=F1ol=27?=: http://www.corpusdelespanol.org
Carlos Subirats
subirats at ICSI.BERKELEY.EDU
Fri Feb 14 01:05:18 UTC 2003
INFOLING. Lista moderada de lingüística española (ISSN: 1576-3404)
http://elies.rediris.es/infoling/
Repetidor (mirror) en EE.UU:
http://listserv.linguistlist.org/archives/infoling.html
Envío de información: infoling-request at listserv.rediris.es
EDITORES:
Carlos Subirats Rüggeberg <subirats at icsi.berkeley.edu>
Mar Cruz Piñol, U. Barcelona <mcruz at fil.ub.es>
Eulalia de Bobes Soler, UAB <Eulalia.deBobes at uab.es>
EQUIPO DE EDICIÓN:
http://elies.rediris.es/infoling/editores.html
La lista de distribución Infoling está asociada a la red temática
ESTUDIOS DE LINGÜÍSTICA ESPAÑOLA http://elies.rediris.es
_________________________________________________________________
Nueva versión en la red del 'Corpus del Español':
http://www.corpusdelespanol.org
Realizado bajo la dirección del Prof. Mark Davies, Illinois State
University (Illinois, EE.UU) con financiación del National Endowment for
the Humanities
_________________________________________________________________
Esta nueva versión del Corpus del Español, a la que se puede acceder
desde:
http://www.corpusdelespanol.org
integra una colección de más de 10.000 textos de los siglos XIII al XX.
El Corpus del Español permite realizar nuevos tipos de búsquedas,
-que hasta ahora no era posible realizar con otros corpora del español
en la red-, como p. ej.:
- búsquedas de sinónimos para más de 30.000 palabras: p. ej.,
cuáles son los sinónimos más comunes de 'inteligente', 'rico',
etc.
- búsquedas de colocaciones, es decir, búsquedas de coocurrencias
entre palabras, en función de su frecuencia, p. ej., cuáles son
los adjetivos más comunes con 'cara', los sustantivos que
concurren con más frecuencia después de 'suave', o los verbos más
comunes con 'chistes';
- búsquedas de frecuencias, como p. ej., qué verbos nuevos han
aparecido desde el siglo XIX, o qué sinónimos de 'roto' son más
comunes en el español escrito que en el español hablado;
- búsqueda de frecuencias en función de:
- la categoría gramatical, p. ej., los infinitivos más comunes
después de 'imposible de', o los adjetivos más comunes
después de 'noche'
- el lema, p. ej., la frecuencia de todas las formas verbales
asociadas al lema 'decir', en el siglo XII, XVI o XX.
- búsquedas de palabras en función de sufijos, p. ej., las palabras
que terminan en '-azo' o búsquedas en función de cadenas de
caracteres internas, p. ej., las palabras que tienen la cadena
'-camin-' en su interior;
- posibilidad de creación de listas de palabras personalizadas,
así p. ej., se pueden crear listas de palabras relacionadas con
las emociones, la ropa, etc., y después se pueden usar en otras
búsquedas;
- búsquedas a partir de combinaciones de búsquedas más sencillas,
p. ej., todas las formas de todos los sinónimos de 'decir',
seguidas de todas las formas de todos los sinónimos de 'chiste'.
Más información y acceso al corpus:
http://www.corpusdelespanol.org
El 'Corpus del Español' tiene un enlace permanente en la web de
Estudios de Lingüística Española http://elies.rediris.es , en la página
de 'Enlaces' y dentro de ella, en la sección de 'Corpus textuales y
bases de datos'
----------------------------------------------------
Web de INFOLING: http://elies.rediris.es/infoling/
------------------------------------------------------
More information about the Infoling
mailing list