<html><body><a href="http://infoling.org" target="_blank"><img
src="http://infoling.org/img/infoling.png" alt="Logo image by Hay
Kranen / CC-BY" width="255" height="50" align="left" border="0" /></a>
<br /><br /><br />
<br /><font style="font-size:80%"><table border="0" bordercolor="#FFF"
width="190px"><tr><td>             </td><td> <a
style="text-decoration:none" href="http://www.facebook.com/infoling"
target="_blank"><img border="0" 
src="http://infoling.org/img/facebook-icon.png" alt="Infoling at
Facebook"  style="vertical-align:-30%;height:16px;width:16px" />
Facebook</a></td><td> <a style="text-decoration:none"
href="http://www.twitter.com/infoling" target="_blank"><img border="0"
src="http://infoling.org/img/t_small-b.png" alt="Infoling at Twitter"
style="vertical-align:-30%;height:16px;width:16px" />
Twitter</a></td></tr></table></font>
<br />Moderador/a: Carlos Subirats (U. Autónoma Barcelona), Mar Cruz
(U. Barcelona)
<br />Editoras: Paloma Garrido (U. Rey Juan Carlos), Laura Romero (UB)
<br />Programación, desarrollo y asesor para informaciones de
lingüística computacional: Marc Ortega (UAB)
<br />Directoras de reseñas: Alexandra Álvarez (U. Los Andes,
Venezuela), Yvette Bürki (U. Bern, Suiza), María Luisa Calero (U.
Córdoba, España)
<br />Asesoras/es: Isabel Verdaguer (UB), Gerd Wotjak (U. Leipzig,
Alemania)
<br />Colaboradoras/es: Julia Bernd (Cause Data Collective, EE.UU),
Antonio Ríos (UAB), Danica Salazar (UB)
<br />
<br />Con el patrocinio de:
<br /><table border="0" bordercolor="#FFFFFF"
width="200px"><tr><!--<td><a href="http://www.fundacioncomillas.es/"
target="_blank"><img
src="http://www.infoling.org/img/logo-comillas.png" alt="Fundación
Comillas" width="85" height="49" align="left" border="0"
/></a></td>--><td><a
href="http://www.arcomuralla.com/Arco/Shop/default.asp"
target="_blank"><img  style="border:0;margin-top:10px"
src="http://www.infoling.org/img/logoarco.jpg" alt="Arco Libros"
width="62" height="34" align="left" border="0"
/></a></td></tr></table><br /><font style="font-size:90%">ISSN:
1576-3404 </font>
<br /><font style="font-size:90%">© Infoling 1996-2012. Reservados
todos los derechos</font>
<br />
<br /></br><hr /><b>Recursos lingüísticos: </b><br />Corpus del
Español Actual: corpus etiquetado de 540 millones de palabras<br
/><b>URL:</b> <a href="http://sfn.uab.es:9080/SFN/tools/cea/spanish"
target="_blank">http://sfn.uab.es:9080/SFN/tools/cea/spanish</a><br
/><b>Información de:</b> Carlos Subirats Rüggeberg
<carlos.subirats@gmail.com><br />Compartir: <a
href="http://api.addthis.com/oexchange/0.8/forward/facebook/offer?url=http://www.infoling.org/informacion/RecursoL57.html&pubid=ra-4def7f4a7565a706"
target="_blank" rel="nofollow"><img border="0"
src="http://infoling.org/img/facebook-icon.png" alt="Send to Facebook"
title="Send to Facebook"
style="vertical-align:-30%;height:16px;width:16px"
/></a>   <a
href="http://api.addthis.com/oexchange/0.8/forward/twitter/offer?url=http://www.infoling.org/informacion/RecursoL57.html&template=@infoling%20Corpus%20del%20Español%20Actual:%20corpus%20etiquetado%20de%20540%20millones%20de%20palabras%20{{url}}&pubid=ra-4def7f4a7565a706&shortener=bitly&bitly.login=infoling&bitly.apiKey=R_60e1d6b1cb688030e7759b835f63d0c0"
target="_blank" rel="nofollow"><img border="0"
src="http://infoling.org/img/t_small-b.png" alt="Tweet this"
title="Tweet this" style="vertical-align:-30%;height:16px;width:16px"
/></a><hr /><p><a
href="http://infoling.org/english/search/recursos/ID/57"
target="_blank">View with English headings</a></p><hr /><br
/><b>Descripción</b><br /><p> El Corpus del Español Actual
(CEA) tiene 540 millones de palabras y está lematizado y etiquetado
con información morfológica y/o categorial. El CEA está integrado
por los siguientes textos:<br /><br />- la parte española del corpus
paralelo español-inglés Europarl: European Parliament Proceedings
Parallel Corpus v. 6 (1996-2010),<br />- el módulo en lengua
española del Wikicorpus v. 1.0, que contiene una parte importante de
la Wikipedia (2006), y<br />- la sección en español del MultiUN:
Multilingual UN Parallel Text 2000-2009, un corpus integrado por
resoluciones de la Organización de las  Naciones Unidas (ONU).<br
/><br />La etiquetación del CEA se ha realizado con una aplicación
que utiliza un diccionario electrónico del español de 635.000 formas
(<a href="http://sfn.uab.es:9080/SFN/tools/dictionary"
target="_blank">http://sfn.uab.es:9080/SFN/tools/dictionary</a>),
generadas automáticamente a partir de un diccionario de 86.000 lemas
simples, como p. ej., unir, inmoralidad, allí, etc., y 26.000 lemas
locutivos, como p. ej., muerte cerebral, carga de profundidad, de
armas tomar, etc. (Subirats 1989, 1992, 1994a, 1994b,  Mogorrón 1994,
Garrido 1999, Ríos 1999, Bobes 2000). La desambiguación de la
etiquetación se ha llevado a cabo mediante un proceso de
intersección de autómatas, que utiliza información léxica y
sintáctica (Subirats 1998, Subirats y Ortega 2000, 2001, Ortega en
preparación).<br /><br />Las búsquedas en el corpus se realizan con
la interfaz gráfica CQPweb (<a
href="http://cwb.sourceforge.net/cqpweb.php"
target="_blank">http://cwb.sourceforge.net/cqpweb.php</a>). Si se
desea realizar búsquedas que incluyan información morfológica y/o
categorial, es necesario consultar el etiquetario del CEA (<a
href="http://sfn.uab.es:9080/SFN/tools/cea/corpus-tags"
target="_blank">http://sfn.uab.es:9080/SFN/tools/cea/corpus-tags</a>),
el cual incluye las etiquetas categoriales y morfológicas que se han
utilizado en su etiquetación.<br /><br />El CEA se ha realizado en el
marco del proyecto de investigación FrameNet Español (FNE <a
href="http://sfn.uab.es:9080/SFN/"
target="_blank">http://sfn.uab.es:9080/SFN/</a>), el cual no sólo ha
puesto en la red los resultados del proyecto, concretamente, un corpus
de oraciones con anotación semántica y sintáctica (<a
href="http://sfn.uab.es:9080/SFN/data"
target="_blank">http://sfn.uab.es:9080/SFN/data</a>), sino además los
recursos lingüísticos utilizados para el desarrollo de dicho
proyecto:<br /><br />- el CEA, que contiene la parte del corpus del
proyecto FNE libre de derechos de autor (<a
href="http://sfn.uab.es:9080/SFN/tools/cea/spanish"
target="_blank">http://sfn.uab.es:9080/SFN/tools/cea/spanish</a>),<br
/>- un analizador sintáctico del español (<a
href="http://sfn.uab.es:9080/SFN/tools/parser"
target="_blank">http://sfn.uab.es:9080/SFN/tools/parser</a>) y<br />-
un diccionario electrónico del español (<a
href="http://sfn.uab.es:9080/SFN/tools/dictionary"
target="_blank">http://sfn.uab.es:9080/SFN/tools/dictionary</a>),<br
/><br />Más información: <a
href="http://sfn.uab.es:9080/SFN/tools/cea/spanish"
target="_blank">http://sfn.uab.es:9080/SFN/tools/cea/spanish</a> <br
/>English version: <a
href="http://sfn.uab.es:9080/SFN/tools/cea/english"
target="_blank">http://sfn.uab.es:9080/SFN/tools/cea/english</a><br
/><br /><br />Referencias<br /><br />- Bobes, Eulàlia de. 2000.
Gramática electrónica de las locuciones verbales. Documento
electrónico no publicado, Laboratorio de Lingüística Informática,
Universidad Autónoma de Barcelona.<br />- Garrido, Paloma. 1999.
Estudio sintáctico del adverbio fijo en predicados comparativos.
Estudios de Lingüística del Español 7<br />- Mogorrón, Pedro.1994.
Estudio contrastivo de las frases 'ser/estar + Prep X’ en español y
‘être + Prep X' en francés. Tesis doctoral, Universidad de
Valencia.<br />- Ortega, Marc. (en preparación). Análisis léxico y
sintáctico automáticos mediante máquinas de estados finitos,
léxicos electrónicos y gramáticas regulares. Tesis doctoral,
Laboratorio de Lingüística Informática, Universidad Autónoma de
Barcelona.<br />- Ríos, Antonio. 1999. La transcripción fonética
automática del Diccionario Electrónico de Formas Simples Flexivas
del Español: un estudio fonológico en el léxico. Estudios de
Lingüística del Español 4.<br />- Subirats, Carlos. 1994a. Sistema
de Diccionarios Electrónicos del Español. Actas del Congreso de la
Lengua Española. Sevilla, 1992. Madrid: Instituto Cervantes, pp.
316-330.<br />- Subirats, Carlos. 1994b. La flexión nominal en el
Diccionario Electrónico de Formas Compuestas del Español. Lingua
Franca 1: 63-69.<br />- Subirats, Carlos. 1992. Verbal, nominal and
adjectival inflection in the Electronic Dictionary of Simple Forms of
Spanish. Lingvisticae Investigationes 16.2: 345-371.<br />- Subirats,
Carlos. 1989. Verbal morphology in the Electronic Dictionary of
Spanish. Lingvisticae Investigationes 13.1: 179-201.<br />- Subirats,
Carlos; Ortega, Marc. 2001. Extracción automática de información de
grandes corpus. En J. De Kock y C. Gómez, eds. La lingüística con
corpus. Catorce aplicaciones sobre el español. Salamanca: Ediciones
Universidad de Salamanca, pp. 155-175.<br />- Subirats, Carlos;
Ortega, Marc. 2000. Tratamiento automático de la información textual
en español mediante bases de información lingüística y
transductores. Estudios de Lingüística del Español 10.</p><br
/><b>Área temática:</b> Lingüística computacional, Lingüística
de corpus<br /><br /><b>Información en la web de Infoling:</b><br />
<a href="http://www.infoling.org/informacion/RecursoL57.html"
target="_blank">
http://www.infoling.org/informacion/RecursoL57.html</a></body></html>