Corpora: Base de Datos Sintácticos, versión 3.5.1/Syntactic Database, release 3.5.1

Paula Santalla del Rio fempsr at usc.es
Thu Apr 19 09:21:23 UTC 2001


________________________________________________________________

Base de Datos Sintácticos del Español Actual (BDS, versión 3.5.1)
_________________________________________________________________

El Grupo de investigación en Sintaxis del Español de la Universidad de
Santiago de Compostela (http://www.sintx.usc.es) acaba de poner a
disposición de todos los investigadores interesados la "Base de datos
sintácticos del español" (BDS), resultado del trabajo realizado en los
últimos diez años. Los datos pueden ser consultados en la dirección

	http://www.bds.usc.es/consultas 

Elaborada gracias a la ayuda financiaciera de la Dirección Xeral de
Educación y Ordenación Universitaria de la Xunta de Galicia y de la
Dirección General de Investigación Científica y Técnica del Ministerio de
Educación, la BDS es el resultado del análisis manual, desde principios
constitutivos y funcionalistas, de las características sintácticas de las
casi 160.000 cláusulas contenidas en la parte contemporánea del Archivo de
Textos Hispánicos de la Universidad de Santiago, constituido por cerca de
millón y medio de palabras tomadas de textos hispánicos (españoles y
americanos) de narrativa, ensayo, prensa y teatro, publicados entre 1980 y
1990, así como transcripciones de lengua oral de la misma época.

En la construcción de la BDS se ha tomado la cláusula como unidad de
descripción y el análisis se ha configurado en torno a la forma verbal que
funciona como predicado. Para cada cláusula se incluyen las
características sintácticas que hemos considerado relevantes en esta
primera fase. En primer lugar, hemos registrado información general acerca
de cada una de las cláusulas: tipo al que pertenece, función que
desempeña, voz, modalidad, flexión del verbo, argumentos sintácticos
presentes y orden en que aparecen. A continuación, hemos registrado
información detallada de cada uno de los argumentos encontrados: tipo de
unidad estructural, determinación, animación, carácter contable o no
contable, preposición introductoria, etc. Las posibilidades de consulta
actualmente abiertas (y las que prevemos desarrollar de modo inmediato)
están orientadas desde un punto de vista interno, es decir, tienen que ver
con la estructura interna de las cláusulas organizadas en torno a los
verbos: esquemas y subesquemas sintácticos en los que los verbos se
documentan en el corpus, verbos que entran en un esquema o subesquema
determinado, verbos que se construyen con una determinada preposición,
etc.

Se trata, de cualquier modo, de una página y un sistema de consulta en
desarrollo, por lo que, aparte de pedir disculpas por el hecho de que
algunas de las opciones de menú no estén todavía activas, agradeceremos
cualquier sugerencia respecto a posibilidades de consulta que se puedan
considerar deseables y no hayamos previsto o no hayamos considerado
prioritarias en esta primera fase de difusión de resultados.

En la actualidad, con la ayuda financiera de la Secretaría Xeral de
Investigación e Desenvolvemento de la Xunta de Galicia, la BDS ha entrado
en su segunda fase, en la que se profundizará en el análisis de los rasgos
sintácticos y semánticos de las aproximadamente 160.000 cláusulas que
componen el corpus estudiado.

_________________________________________________________

Syntactic Database of Current Spanish (SDB, release 3.5.1)
__________________________________________________________

The research group on Spanish Syntax of the University of Santiago de
Compostela (http://www.sintx.usc.es) makes available for the interested
researchers the Syntactic Spanish Database (SDB), the result of the work
carried out by the group throughout the last ten years. The data can be
looked up in

	http://www.bds.usc.es/consultas

Developed with the financial support of the Dirección Xeral de Educación y
Ordenación Universitaria of the Xunta de Galicia and of the Dirección
General de Investigación Científica y Técnica of the Ministerio de
Educación, SDB is the result of the manual analysis, having in mind
constitutional and functional analysis principles, of the syntactic
characteristics of the almost 160.000 clauses contained in the
contemporary part of the Hispanic Texts Archive of the University of
Santiago, constituted by approximately million and a half words of texts
taken from all the Hispanic countries and including oral samples as well
as novels, press and theater, all of them published between 1980 and 1990.

In SDB the primary unit of description has been the clause and the
analysis has been encoded so as to make obvious the organization of the
syntactic functions around the verb form functioning as the predicate of
the clause. For every clause in the database, the syntactic
characteristics considered relevant in this first stage of development
have been included. In first place, we have recorded general information
about the clauses: clause type, clause function, voice, modality, verb
inflection, syntactic functions found in the clause and order of them.
Next, we have recorded detailed information about each of the syntactic
functions found in the clause: type of structural unit, determination,
animation, countability, preposition introducing the syntactic function,
etc. Current search possibilities (as well as other not yet fully
available but already on schedule) are conceived from an internal point of
view, that is, they are devised so as to show the internal structure of
clauses organized around verb forms in the corpus: syntactic schemes and
subschemes of each verb documented in it, verbs documented with one scheme
or subscheme, verbs requiring one preposition, etc.

These are, however, a web page and a search interface still under
development. For this reason, on the one hand, we apologize for the fact
that certain search options on the menu are not yet ready, and on the
other, we will be very grateful for any suggestion about search
possibilities that you miss in the system and to which we have not given
priority in this first phase of distribution of results.

Currently, with the financial support of the Secretaría Xeral de
Investigación e Desenvolvemento of the Xunta de Galicia, SDB has started a
second phase of development in which we will analyse in depth the
syntactic and semantic characteristics of the approximately 160.000
clauses constituting the corpus under study.

------------------------------------------------------------------------
------------------------------------------------------------------------
------------------------------------------------------------------------
 María Paula Santalla del Río

  Dpto. de Lingua Española
  Facultade de Filoloxía, Universidade de Santiago de Compostela
  Avda. Burgo das Nacións, s/n,
  Santiago de Compostela 15782

      Tfno: (+34) 981 575340/563100, ext. 11908
      Fax: (+34) 981 574646
-----------------------------------------------------------------------
-----------------------------------------------------------------------
-----------------------------------------------------------------------



More information about the Corpora mailing list