Muestra de los resultados del proyect o de investigaci ón "FrameNet Español"
Carlos Subirats
carlos.subirats at GMAIL.COM
Wed Sep 5 17:05:30 UTC 2007
------------------- INFOLING --------------------
Lista de distribución sobre lingüística del español (ISSN: 1576-3404): http://elies.rediris.es/infoling/
Envío de información: infoling-request at listserv.rediris.es
EDITORES:
Carlos Subirats Rüggeberg, UAB <carlos.subirats at uab.es>
Mar Cruz Piñol, U. Barcelona <mcruz at ub.edu>
Eulalia de Bobes Soler, U. Abat Oliba-CEU <debobes1 at uao.es>
Equipo de edición: http://elies.rediris.es/infoling/editores.html
Estudios de Lingüística del Español (ELiEs): http://elies.rediris.es
es una red temática de lingüística del español asociada a INFOLING.
---------------------------------------------------------------------
INFOLING: una lista independiente y global
© Infoling (España), 1998-2007. Reservados todos los derechos
--------------------------------------------------------------------------
Muestra de los resultados del proyecto de investigación "FrameNet Español":
http://gemini.uab.es:9080/SFNsite/sfn-data-1/sfn-sample-data-1
(Versión completa de los resultados de FrameNet Español: marzo de 2008)
--------------------------------------------------------------------------
1. Ya se puede consultar en la red una muestra de los resultados del
proyecto de investigación "FrameNet Español":
http://gemini.uab.es:9080/SFNsite/sfn-data-1/sfn-sample-data-1
El proyecto FrameNet Español ha creado un corpus de 13.000 oraciones
con anotación semántica y sintáctica, partiendo de la teoría de la
semántica de marcos [cf. NOTA 1 al final de esta información]. Este
corpus se está utilizando como corpus de entrenamiento de una
aplicación de anotación automática de roles semánticos en español. El
proyecto se desarrolla en la Universidad Autónoma de Barcelona
(España) y en el International Computer Science Institute, Berkeley CA
(EE.UU). Mas información: http://gemini.uab.es/SFN
La muestra que presentamos ahora incluye la anotación semántica y
sintáctica de 320 oraciones en las que se estudian 16 unidades léxicas
(20 oraciones aprox. por cada unidad léxica), que pertenecen a nueve
marcos semánticos distintos.
La versión completa de los resultados de FrameNet Español estará
disponible en la red en marzo de 2008 y se podrá acceder a dichos
resultados desde la web del proyecto en http://gemini.uab.es/SFN
Las 16 entradas de la muestra que presentamos ahora, en las que hay
verbos, nombres y adjetivos predicativos, son las siguientes:
- acercarse
- acudir
- adentrarse
- amenaza
- aproximarse
- correr un riesgo
- en peligro
- extraer
- girar
- inseguro
- peligrar
- predecir
- prever
- promesa
- sorprendido
Estas entradas se integran dentro de los nueve marcos semánticos siguientes:
- Arriving
- Being_at_risk
- Change_direction
- Commitment
- Expectation
- Experiencer_subj
- Predicting
- Removing
- Risky_situation
La muestra de resultados en:
http://gemini.uab.es:9080/SFNsite/sfn-data-1/sfn-sample-data-1
se presenta en forma de una lista de unidades léxicas, ordenadas por
orden alfabético. Cada unidad léxica está asociada a tres enlaces:
- El primer enlace (de izquierda a derecha) permite acceder a una
descripción del marco semántico al que pertenece la unidad léxica
correspondiente:
- El segundo enlace permite acceder al Lexical Entry Report (abreviado
LE), una organización automática de los resultados de la anotación
semántica y sintáctica en la que figura la siguiente información:
- la lista de roles o argumentos semánticos (frame elements,
abreviado FE), que han sido utilizados en la anotación de
construcciones sintácticas en las que aparece una unidad léxica
específica, junto con la especificación de (1) el tipo de
constituyente (phrase type, abreviado PT), (2) su función sintáctica
(grammatical function, abreviado GF) [cf. NOTA 2 al final de esta
información] y (3) la especificación del número de veces que aparecen
en la anotación;
- la lista de las construcciones sintácticas en las que aparecen
los roles semánticos.
- El tercer enlace (abreviado Anno) nos lleva a las oraciones con
anotación semántica, relacionadas con el estudio de una unidad léxica
específica. En primer lugar, aparece la lista de roles o argumentos
semánticos que se utilizan en la anotación. Cada uno de dichos roles
tiene un color distinto, lo que permite distinguirlos fácilmente. Tras
la lista de roles, se encuentran las oraciones anotadas
semánticamente, en las que los constituyentes anotados tienen el color
del rol semántico correspondiente, tal como aparece al principio.
2. La primera versión completa de los datos del proyecto FrameNet
Español se hará pública el próximo mes de marzo de 2008. Esta versión
incluirá más de 14.000 oraciones anotadas, que son el resultado del
análisis de más de 700 unidades léxicas, relacionadas con 240 marcos
semánticos distintos. Los resultados del proyecto se podrán consultar
con dos aplicaciones:
- un programa que organiza automáticamente los resultados de la
anotación semántica y sintáctica (web reports). Este programa tendrá
dos versiones:
- la versión estática, que es análoga a la que presentamos ahora en
la primera muestra de los resultados del proyecto FrameNet Español;
- la versión dinámica --tras solicitar un passoword-- que ofrece
posibilidades de navegación ampliadas. En el futuro, esta versión
también será de dominio público (sin necesidad de utilizar password)
en función de las disponibilidades materiales del proyecto.
- el programa FrameSQL, desarrollado y adaptado al español por el
Prof. Hiroaki Sato de la Universidad de Senshu (Japón), que permite
realizar consultas:
- en la base de datos de FrameNet Español y
- realizar consultas simultáneas en FrameNet Español y en FrameNet
inglés (http://framenet.icsi.berkeley.edu/), lo cual permite utilizar
ambas bases de datos como un diccionario semántico bilingüe online
español-inglés.
MÁS INFORMACIÓN:
- Muestra de los resultados del proyecto de investigación FrameNet Español:
http://gemini.uab.es:9080/SFNsite/sfn-data-1/sfn-sample-data-1
- Web del proyecto FrameNet Español: http://gemini.uab.es/SFN
- Acceso a las publicaciones sobre el proyecto de investigación
FrameNet Español: http://gemini.uab.es:9080/SFNsite/papers/sfn-papers
- Informaciones anteriores sobre FrameNet Español aparecidas en Infoling:
http://listserv.rediris.es/cgi-bin/wa?A2=ind0506&L=infoling&P=R2442&X=0FADE117C9DE65D832&Y=subirats%40icsi.berkeley.edu
---------------------------------------------
NOTAS
NOTA 1:
Referencias:
- Fillmore, Charles J. (1982):Frame semantics. In Linguistics in the
Morning Calm, Seoul, Hanshin Publishing Co., 111-137
- Fillmore, Charles J. (1985): Frames and the semantics of
understanding. In Quaderni di Semantica, Vol. 6.2: 222-254
- Fillmore, Charles J., Christopher R. Johnson and Miriam R.L. Petruck
(2003) Background to Framenet, International Journal of Lexicography,
Vol 16.3: 235-250.
- Petruck, Miriam R. L. (1996): Frame Semantics. In Jef Verschueren,
Jan-Ola Östman, Jan Blommaert, and Chris Bulcaen (eds.). Handbook of
Pragmatics 1996. Philadelphia: John Benjamins:
http://framenet.icsi.berkeley.edu/~framenet/papers/miriamp.FS2.pdf
NOTA 2
La lista completa de todas las tipos de constituyentes y funciones
sintácticas utilizadas en la anontación de FrameNet español se puede
encontrar en:
http://gemini.uab.es:9080/SFNsite/sfn-data-1/sfn-pt-s-and-gf-s
Se puede acceder a este enlace desde la web del proyecto FrameNet
Español en http://gemini.uab.es/SFN, pinchando en el último enlace del
menu de la izquierda, concreamente, en "SFN Sample Data". Este enlace
nos lleva a otro menu, en el que hay tres enlaces. Hay que pinchar
sobre "SFN PT's and GF's".
----------------------------------------------------------------------
DEIBERT, Ronald J.; PALFREY, John G.; ROHOZINSKI, Rafal; ZITTRAIN, Jonathan, eds. Access Denied. The Practice and Policy of Global Internet Filtering. Cambridge, MA: MIT Press.
http://mitpress.mit.edu/catalog/item/default.asp?ttype=2&TID=11329
Many countries around the world block or filter Internet content, denying access to information - often about politics, but also relating to sexuality, culture, or religion - that they deem too sensitive for ordinary citizens. 'Access Denied' documents and analyzes Internet filtering practices in over three dozen countries, offering the first rigorously conducted study of an accelerating trend.
Open Net Initiative: http://opennet.net/
----------------------------------------------------------------------
More information about the Infoling
mailing list