nformacion sobre proyecto de investigacion: SenSem: Banco de datos sintactico y semantico del espanol
Carlos Subirats
carlos.subirats at GMAIL.COM
Thu May 18 19:10:19 UTC 2006
-------------------------- INFOLING ------------------------------
Lista de distribución de lingüística del español (ISSN: 1576-3404)
http://elies.rediris.es/infoling/
Envío de información: infoling-request at listserv.rediris.es
EDITORES:
Carlos Subirats Rüggeberg, UAB <carlos.subirats at uab.es>
Mar Cruz Piñol, U. Barcelona <mcruz at ub.edu>
Eulalia de Bobes Soler, U. Abat Oliba-CEU <debobes1 at uao.es>
Equipo de edición: http://elies.rediris.es/infoling/editores.html
Estudios de Lingüística del Español (ELiEs): http://elies.rediris.es
es una red temática de lingüística del español asociada a INFOLING.
© Copyright Infoling
------------------------------------------------------------------
Información sobre proyecto de investigación:
SenSem: Banco de datos sintáctico y semántico del español
Informaciòn sobre el proyecto:
http://grial.uab.es/index.php?idioma=es
Consulta de resultados:
http://grial.uab.es/search/index.php?idioma=es
Duración del proyecto: 2004/06
Financiado por el Ministerio de Ciencia y Tecnología de España (BFF2003-06456)
------------------------------------------------------------------
El proyecto SenSem, que está desarrollando el grupo de investigación
GRIAL en Barcelona (España) (http://grial.uab.es/index.php?idioma=es),
consiste en la creación de un banco de datos en el que se describe el
comportamiento sintáctico-semántico de los verbos del español. Se
dispondrá de dos recursos: un corpus anotado y un léxico verbal.
El corpus está constituido por 25.000 oraciones que se han
seleccionado de un conjunto de textos de estilo periodístico del
español. La selección se ha llevado a cabo a partir de los 250
verbos más frecuentes de esta lengua y se han considerado 100 frases
para cada verbo, por lo que es posible que no estén ejemplificados
todos los sentidos.
La anotación se ha hecho manualmente a través de una herramienta de
anotación creada en el marco del proyecto. Las oraciones se han
anotado a 3 niveles: el verbo, como unidad léxica (sentido, uso
metafórico, etc.), los constituyentes de la oración dominados por el
verbo (categoría sintagmática, función sintáctica, rol semántico y
argumentalidad) y la semántica oracional (aspecto, antiagentividad,
anticausatividad, reflexividad, etc.). El corpus anotado se puede
consultar vía web a través de una interfaz de búsqueda en:
http://grial.uab.es/search/index.php?idioma=es
Los resultados de las búsquedas también se pueden visualizar en formato XML.
En el léxico verbal, en:
http://grial.uab.es/sentits/index.php?idioma=es
cada sentido está asociado a su definición, el tipo aspectual
prototípico, los papeles semánticos y las correspondencias con la red
semántica WordNet. Al final del proyecto, se incluirán también, para
cada sentido, ejemplos representativos extraídos del corpus anotado,
así como los diferentes patrones de subcategorización del verbo,
indicando, para cada argumento, su categoría sintagmática, la función
sintáctica y el papel semántico. Además, también se incorporarán las
restricciones de selección y las preposiciones a partir de la
información extraída del corpus.
Actualmente se está llevando a cabo la fase de revisión de la
anotación y la constitución de la base de datos léxica. Se prevé
finalizar el proyecto a finales del 2006. Todas las herramientas y
recursos que se han ido construyendo en el marco del proyecto
(léxico, corpus e interfaces de búsqueda y anotación) estarán
disponibles para la comunidad universitaria para entonces. Para
obtener más información sobre el proyecto, como las publicaciones
relacionadas, se puede consultar: http://grial.uab.es/projectes/sensem
Más información: grial at delfos.uab.es
----------------------------------------------------------------------
Utiliza el buscador de Infoling en http://elies.rediris.es/infoling/
para realizar búsquedas en los mensajes enviados a la lista desde 1998.
----------------------------------------------------------------------
More information about the Infoling
mailing list