[Corpora-List] Web-Accessible Spanish Corpora
Mario Crespo Miguel
mario.crespo at uca.es
Tue Jul 31 08:09:39 UTC 2007
Dear Marc Carmen,
Below you will find a list of corpora for Spanish. Although this
is not the whole list of corpora for Spanish and not all of them
are available on-line, I hope it can help you. Best wishes,
Mario
1. RAW CORPORA:
- BEC (Biblioteca Electrónica Cristiana).
- ECI/ MCI Corpus (European Corpus Initiative Mltilingual
Corpus).
- Elaleph Com Biblioteca.
- Parnaseo LEMIR Texts (Textos de Literatura Española Medieval y
del renacimiento).
- VISL online English Corpus.
- Cumbre, Corpus lingüístico del español contemporáneo.
- El corpus DIME.
- El Corpus de verificación del sistema de diccionarios y
gramáticas electrónicos del español (CorVerifSDGEE).
- SISCOOR (Sistema de consultas coordinadas).
- El Corpus del español de la República Argentina y el Corpus
Chileno de Referencia.
- Corpus de la IBM España.
2. PARTIALLY ANNOTATED:
- Antología del Ensayo Iberoamericano.
- Bible of Universjty of Maryland Parallel Corpus Project.
- CALLHOME Spanish Transcripts.
- Child Language Exchange System (CHILDES)
- Gonzalo de Berceo - Obras completas.
- Hub-4Ne - Spanish Broadcast News Transcripts 1997.
- Hub-5 Spanish Transcripts.
- IntraThxt Library.
- CRATER Parallel Corpus.
- JOC-CES Multilingual.
- Lieder and Songs Texts Page.
- Corpus del Español Mexicano Contemporaneo(CEMC).
- María o Lopez Ornat Corpus.
- Corpus del Derecho Ambiental Mexicano (CDAM).
- Archivo Gramatical de la Lengua Española (AGLE).
- Mark Davies' collection.
- UN Parallel Text Corpus (United Nations Parallel Texts).
- UAM Treebank.
- LexEsp (Léxico informatizado del español).
- CLiC-TALP .
- CREA y CORDE.
- ARTHUS (Archivo de textos hispánicos de la Universidad de
Santiago de Compostela).
- DICE.
- Corpus ENTREVIS.
- El Corpus Oral del Español Peninsular (1.100.000 palabras
aprox.)
- BDS (Base de Datos sintácticos del español).
- Cast3LB (Banco de árboles sintáctico-semánticos del español).
- Spanish FrameNet.
- Construction of a Basque Dependency Treebank.
- Proyecto ADESSE: Alternancias de diátesis y esquemas
sintáctico-semánticos del español
_______________________________________________
Corpora mailing list
Corpora at uib.no
http://mailman.uib.no/listinfo/corpora
More information about the Corpora
mailing list