Ampliación de información: 'Corpus del Español' http://www.corpusdelespanol.org
Carlos Subirats Rüggeberg
subirats at ICSI.BERKELEY.EDU
Sat Feb 22 07:49:04 UTC 2003
INFOLING. Lista moderada de lingüística española (ISSN: 1576-3404)
http://elies.rediris.es/infoling/
Repetidor (mirror) en EE.UU:
http://listserv.linguistlist.org/archives/infoling.html
Envío de información: infoling-request at listserv.rediris.es
EDITORES:
Carlos Subirats Rüggeberg <subirats at icsi.berkeley.edu>
Mar Cruz Piñol, U. Barcelona <mcruz at fil.ub.es>
Eulalia de Bobes Soler, UAB <Eulalia.deBobes at uab.es>
EQUIPO DE EDICIÓN: http://elies.rediris.es/infoling/editores.html
La lista de distribución Infoling está asociada a la red temática
ESTUDIOS DE LINGÜÍSTICA ESPAÑOLA http://elies.rediris.es
_________________________________________________________________
Ampliación de información:
'Corpus del Español' en la red: http://www.corpusdelespanol.org
Realizado bajo la dirección del Prof. Mark Davies, Illinois State
University (Illinois, EE.UU) con financiación del National Endowment
for the Humanities
Información anterior aparecida de Infoling:
http://listserv.rediris.es/cgi-bin/wa?A2=ind0302&L=infoling&F=&S=&P=2415
[Cuando, el 13 de febrero, se anunció el Corpus del Español en Infoling,
no se podía visulizar adecuadamente con algunas versiones de Netscape.]
_________________________________________________________________
El Corpus del Español http://www.corpusdelespanol.org tiene 100
millones de palabras y está integrado por una colección de más de 10.000
textos de los siglos XIII al XX.
El Corpus del Español permite realizar nuevos tipos de búsquedas,
-que hasta ahora no era posible realizar en otros corpora del español en
la red-, como p. ej.:
- búsquedas de sinónimos para más de 30.000 palabras: p. ej., cuáles son
los sinónimos más comunes de 'inteligente':
http://www.corpusdelespanol.org/?cl=es&ex=1
'rico', etc.:
http://www.corpusdelespanol.org/?cl=es&ex=2
[Algunas versiones de Netscape, p. ej., 4.X y posiblemente otras, no
permiten visualizar estos enlaces.]
- búsquedas de colocaciones, es decir, búsquedas de coocurrencias entre
palabras, en función de su frecuencia, p. ej.:
- cuáles son los adjetivos más comunes con 'cara':
http://www.corpusdelespanol.org/?cl=es&ex=3
- los sustantivos que concurren con más frecuencia después de 'suave':
http://www.corpusdelespanol.org/?cl=es&ex=4
- o los verbos más comunes con 'chistes':
http://www.corpusdelespanol.org/?cl=es&ex=5
- búsquedas de frecuencias, como p. ej.:
- qué verbos nuevos han aparecido desde el siglo XIX:
http://www.corpusdelespanol.org/?cl=es&ex=6
- qué sinónimos de 'roto' son más comunes en el español escrito que en
el español hablado:
http://www.corpusdelespanol.org/?cl=es&ex=7
- búsqueda de frecuencias en función de:
- la categoría gramatical, p. ej., los infinitivos más comunes después
de 'imposible de':
http://www.corpusdelespanol.org/?cl=es&ex=8
- los adjetivos más comunes después de 'noche':
http://www.corpusdelespanol.org/?cl=es&ex=9
- el lema, p. ej., la frecuencia de todas las formas verbales
asociadas al lema 'decir', en el siglo XII
http://www.corpusdelespanol.org/?cl=es&ex=10a
- el siglo XVI:
http://www.corpusdelespanol.org/?cl=es&ex=10b
- o el siglo XX:
http://www.corpusdelespanol.org/?cl=es&ex=10c
- búsquedas de palabras en función de sufijos, p. ej., las palabras que
terminan en '-azo':
http://www.corpusdelespanol.org/?cl=es&ex=11
- o búsquedas en función de cadenas de caracteres internas, p. ej., las
palabras que tienen la cadena '-camin-' en su interior:
http://www.corpusdelespanol.org/?cl=es&ex=12
- posibilidad de creación de listas de palabras personalizadas, así p.
ej., se pueden crear listas de palabras relacionadas con las
emociones:
http://www.corpusdelespanol.org/?cl=es&ex=13
la ropa, etc.:
http://www.corpusdelespanol.org/?cl=es&ex=14
y después se pueden usar en otras búsquedas:
http://www.corpusdelespanol.org/?cl=es&ex=15
- búsquedas a partir de combinaciones de búsquedas más sencillas, p.ej.,
todas las formas de todos los sinónimos de 'decir', seguidas de todas
las formas de todos los sinónimos de 'chiste'.
Acceso al Corpus del Español: http://www.corpusdelespanol.org
El 'Corpus del Español' tiene un enlace permanente en la web de Estudios
de Lingüística Española http://elies.rediris.es , en la página de
'Enlaces' y dentro de ella, en la sección de 'Corpus textuales y bases
de datos'
----------------------------------------------------
Web de INFOLING: http://elies.rediris.es/infoling/
----------------------------------------------------
More information about the Infoling
mailing list