Información sobre proyecto de investigación: FrameNet Español. Un diccionario semántico online del español: http://gemini.uab.es/SFN

Carlos Subirats Rüggeberg carlos.subirats at UAB.ES
Mon Jun 20 13:33:30 UTC 2005


--------------------------   INFOLING   ------------------------------
 Lista de distribución de lingüística del español (ISSN: 1576-3404)
                  http://elies.rediris.es/infoling/
    Envío de información: infoling-request at listserv.rediris.es
                             EDITORES:
       Carlos Subirats Rüggeberg, UAB <carlos.subirats at uab.es>
           Mar Cruz Piñol, U. Barcelona <mcruz at ub.edu>
        Eulalia de Bobes Soler, UAB <Eulalia.deBobes at uab.es>
 Equipo de edición: http://elies.rediris.es/infoling/editores.html
Estudios de Lingüística del Español (ELiEs): http://elies.rediris.es
es una red temática de lingüística del español asociada a INFOLING.
----------------------------------------------------------------------

Infoling y ELiEs se editan con el patrocinio del Ministerio de
Ciencia y Tecnología de España (DIF2003-10302-E): http://www.mcyt.es

--------------------------------------------------------------------------
                Información sobre proyecto de investigación:
      FrameNet Español: una diccionario semántico online para el español
                        http://gemini.uab.es/SFN
   Financiado por el Ministerio de Ciencia y Tecnología (TIC2002-01338)
--------------------------------------------------------------------------

                            1. Objetivos

    El objetivo del proyecto FrameNet Español (http://gemini.uab.es/SFN)
es la creación de un diccionario semántico online del español. Las
entradas de este diccionario online serán predicados (verbos, nombres y
adjetivos predicativos), que estarán integrados en una red de marcos
semánticos (cf. Fillmore, Charles J. 1985. Frames and the semantics of
understanding. Quaderni di Semantica 6.2:222-254).

    Cada una de las entradas de FrameNet español constará de:

- una definición de su significado,
- una definición del marco semántico al que pertenece, y
- un conjunto de oraciones anotadas semántica y sintácticamente, que
   ilustrarán las construcciones sintácticas en las que se proyectan sus
   argumentos semánticos.

    La primera versión de FrameNet Español incluirá oraciones anotadas
semántica y sintácticamente, que mostrarán las características
semánticas y sintácticas de 1.000 predicados aprox., pertenecientes a
los dominios semánticos de cognición, comunicación, emoción, movimiento
y percepción.

    El software de consulta de FrameNet Español permitirá realizar
búsquedas sobre:

- los argumentos semánticos de cada predicado y/o
- las construcciones sintácticas en las que se proyectan dichos
   argumentos semánticos.

     Asimismo, el software de consulta permitirá realizar búsquedas
simultáneas sobre los resultados de FrameNet español y de FrameNet
inglés (http://framenet.icsi.berkeley.edu/) y, por tanto, este proyecto
se podrá utilizar también como un diccionario semántico bilingüe online
español-inglés e inglés-español.

    A partir de julio de 2006, la base de datos del proyecto FrameNet
español será de dominio público:

    - se podrá consultar libremente vía web desde cualquier plataforma y
      con cualquier navegador;
    - tras la solicitud de una licencia de uso gratuita, se podrá
      descargar libremente de la red:
         - tanto el contenido de la base de datos, es decir, el corpus de
           oraciones anotadas semántica y sintácticamente (en formato
           XML, HTML y OWL), como
         - el software para su gestión y consulta.


          2. Acceso a las herramientas para el desarrollo del proyecto

    La web de FrameNet Español incluye también las herramientas
utilizadas en dicho proyecto para realizar el tratamiento automático del
corpus. Dichas herramientas son e-Lexicon y e-Tagger:

    - e-Lexicon (http://gemini.uab.es/elexicon/busca_dico.html) es un
      software que permite realizar consultas léxicas en un
      diccionario-e de 600.000 formas:
      - 550.000 formas simples (o palabras ortográficas)
        correspondientes a 67,000 lemas;
      - 58.000 formas locutivas correspondientes a 28,000 lemas
        locutivos, que incluyen:
        - grupos preposicionales predicativos, como p. ej.
         'de moda', y
        - locuciones verbales, como p. ej., 'dar la lata', 'tener en
          cuenta', etc.

    - e-Tagger (http://gemini.uab.es/SFN/etiquetador/index.html) es un
      etiquetador, lematizador y analizador morfológico de textos.


                              Más información:
                         http://gemini.uab.es/SFN
                             Webs relacionadas:
                   http://gemini.uab.es/SFN/SFN_Links.htm

----------------------------------------------------------------------
Los mensajes de INFOLING llegan hasta tu buzón gracias al servicio
técnico de RedIRIS (Madrid, España): http://www.rediris.es
----------------------------------------------------------------------



More information about the Infoling mailing list