Ampliación de información: 'Corpus del Español' http://www.corpusdelespanol.org

Carlos Subirats Rüggeberg subirats at ICSI.BERKELEY.EDU
Sat Feb 22 07:49:04 UTC 2003


  INFOLING. Lista moderada de lingüística española (ISSN: 1576-3404)

                   http://elies.rediris.es/infoling/
                      Repetidor (mirror) en EE.UU:
        http://listserv.linguistlist.org/archives/infoling.html
       Envío de información: infoling-request at listserv.rediris.es
                               EDITORES:
         Carlos Subirats Rüggeberg <subirats at icsi.berkeley.edu>
             Mar Cruz Piñol, U. Barcelona <mcruz at fil.ub.es>
         Eulalia de Bobes Soler, UAB <Eulalia.deBobes at uab.es>
   EQUIPO DE EDICIÓN: http://elies.rediris.es/infoling/editores.html
La lista de distribución Infoling está asociada a la red temática
ESTUDIOS DE LINGÜÍSTICA ESPAÑOLA http://elies.rediris.es
_________________________________________________________________

                      Ampliación de información:
   'Corpus del Español' en la red:  http://www.corpusdelespanol.org
Realizado bajo la dirección del Prof. Mark Davies, Illinois State
University (Illinois, EE.UU) con financiación del National Endowment
for the Humanities
            Información anterior aparecida de Infoling:
http://listserv.rediris.es/cgi-bin/wa?A2=ind0302&L=infoling&F=&S=&P=2415
[Cuando, el 13 de febrero, se anunció el Corpus del Español en Infoling,
  no se podía visulizar adecuadamente con algunas versiones de Netscape.]
_________________________________________________________________

    El Corpus del Español http://www.corpusdelespanol.org tiene 100
millones de palabras y está integrado por una colección de más de 10.000
textos de los siglos XIII al XX.

    El Corpus del Español permite realizar nuevos tipos de búsquedas,
-que hasta ahora no era posible realizar en otros corpora del español en
la red-, como p. ej.:

- búsquedas de sinónimos para más de 30.000 palabras: p. ej., cuáles son
   los sinónimos más comunes de 'inteligente':
               http://www.corpusdelespanol.org/?cl=es&ex=1
   'rico', etc.:
               http://www.corpusdelespanol.org/?cl=es&ex=2

   [Algunas versiones de Netscape, p. ej., 4.X y posiblemente otras, no
   permiten visualizar estos enlaces.]

- búsquedas de colocaciones, es decir, búsquedas de coocurrencias entre
   palabras, en función de su frecuencia, p. ej.:

   - cuáles son los adjetivos más comunes con 'cara':
               http://www.corpusdelespanol.org/?cl=es&ex=3
   - los sustantivos que concurren con más frecuencia después de 'suave':
               http://www.corpusdelespanol.org/?cl=es&ex=4
   - o los verbos más comunes con 'chistes':
               http://www.corpusdelespanol.org/?cl=es&ex=5

- búsquedas de frecuencias, como p. ej.:

   - qué verbos nuevos han aparecido desde el siglo XIX:
               http://www.corpusdelespanol.org/?cl=es&ex=6
   - qué sinónimos de 'roto' son más comunes en el español escrito que en
     el español hablado:
               http://www.corpusdelespanol.org/?cl=es&ex=7

- búsqueda de frecuencias en función de:

   - la categoría gramatical, p. ej., los infinitivos más comunes después
     de 'imposible de':
                http://www.corpusdelespanol.org/?cl=es&ex=8
   - los adjetivos más comunes después de 'noche':
                http://www.corpusdelespanol.org/?cl=es&ex=9
   - el lema, p. ej., la frecuencia de todas las formas verbales
     asociadas al lema 'decir', en el siglo XII
                http://www.corpusdelespanol.org/?cl=es&ex=10a
   - el siglo XVI:
                http://www.corpusdelespanol.org/?cl=es&ex=10b
   - o el siglo XX:
                http://www.corpusdelespanol.org/?cl=es&ex=10c

- búsquedas de palabras en función de sufijos, p. ej., las palabras que
   terminan en '-azo':
                http://www.corpusdelespanol.org/?cl=es&ex=11
- o búsquedas en función de cadenas de caracteres internas, p. ej., las
   palabras que tienen la cadena '-camin-' en su interior:
                http://www.corpusdelespanol.org/?cl=es&ex=12

- posibilidad de creación de listas de palabras personalizadas, así p.
   ej., se pueden crear listas de palabras relacionadas con las
   emociones:
                http://www.corpusdelespanol.org/?cl=es&ex=13
   la ropa, etc.:
                http://www.corpusdelespanol.org/?cl=es&ex=14
   y después se pueden usar en otras búsquedas:
                http://www.corpusdelespanol.org/?cl=es&ex=15

- búsquedas a partir de combinaciones de búsquedas más sencillas, p.ej.,
   todas las formas de todos los sinónimos de 'decir', seguidas de todas
   las formas de todos los sinónimos de 'chiste'.

   Acceso al Corpus del Español: http://www.corpusdelespanol.org

El 'Corpus del Español' tiene un enlace permanente en la web de Estudios
de Lingüística Española http://elies.rediris.es , en la página de
'Enlaces' y dentro de ella, en la sección de 'Corpus textuales y bases
de datos'

----------------------------------------------------
Web de INFOLING: http://elies.rediris.es/infoling/
----------------------------------------------------



More information about the Infoling mailing list