[Corpora-List] Web-Accessible Spanish Corpora

Mario Crespo Miguel mario.crespo at uca.es
Tue Jul 31 08:09:39 UTC 2007


Dear Marc Carmen,

Below you will find a list of corpora for Spanish. Although this 
is not the whole list of corpora for Spanish and not all of them 
are available on-line, I hope it can help you. Best wishes,

Mario



1.	RAW CORPORA:



-	BEC (Biblioteca Electrónica Cristiana).

-	ECI/ MCI Corpus (European Corpus Initiative Mltilingual 
Corpus).

-	Elaleph Com Biblioteca.

-	Parnaseo LEMIR Texts (Textos de Literatura Española Medieval y 
del renacimiento).

-	VISL online English Corpus.

-	Cumbre, Corpus lingüístico del español contemporáneo.

-	El corpus DIME.

-	El Corpus de verificación del sistema de diccionarios y 
gramáticas electrónicos del español (CorVerifSDGEE).

-	SISCOOR (Sistema de consultas coordinadas).

-	El Corpus del español de la República Argentina y el Corpus 
Chileno de Referencia.

-	Corpus de la IBM España.




2.	PARTIALLY ANNOTATED:

-	Antología del Ensayo Iberoamericano.

-	Bible of Universjty of Maryland Parallel Corpus Project.

-	CALLHOME Spanish Transcripts.

-	Child Language Exchange System (CHILDES)

-	Gonzalo de Berceo - Obras completas.

-	Hub-4Ne - Spanish Broadcast News Transcripts 1997.

-	Hub-5 Spanish Transcripts.

-	IntraThxt Library.

-	CRATER Parallel Corpus.

-	JOC-CES Multilingual.

-	Lieder and Songs Texts Page.

-	Corpus del Español Mexicano Contemporaneo(CEMC).

-	María o Lopez Ornat Corpus.

-	Corpus del Derecho Ambiental Mexicano (CDAM).

-	Archivo Gramatical de la Lengua Española (AGLE).

-	Mark Davies' collection.

-	UN Parallel Text Corpus (United Nations Parallel Texts).

-	UAM Treebank.

-	LexEsp (Léxico informatizado del español).

-	CLiC-TALP .

-	CREA y CORDE.

-	ARTHUS (Archivo de textos hispánicos de la Universidad de 
Santiago de Compostela).

-	DICE.

-	Corpus ENTREVIS.

-	El Corpus Oral del Español Peninsular (1.100.000 palabras 
aprox.)

-	BDS (Base de Datos sintácticos del español).

-	Cast3LB (Banco de árboles sintáctico-semánticos del español).


-	Spanish FrameNet.

	
-	Construction of a Basque Dependency Treebank.

-	Proyecto ADESSE:  Alternancias de diátesis y esquemas 
sintáctico-semánticos del español


_______________________________________________
Corpora mailing list
Corpora at uib.no
http://mailman.uib.no/listinfo/corpora



More information about the Corpora mailing list