Nueva página del Laboratorio de Lingüística Informática de la UAB

Carlos Subirats Rüggeberg Carlos.Subirats at UAB.ES
Mon Dec 7 13:05:17 UTC 1998


INFOLING  Lista moderada de lingüística española
http://listserv.rediris.es/archives/infoling.html
Envío de información: INFOLING at listserv.rediris.es
Editor: Carlos Subirats Rüggeberg <Carlos.Subirats at uab.es>
Colaboradoras:
Paola Bentivoglio <pbentivo at reacciun.ve>, UCV
Eulalia de Bobes <ebobes at seneca.uab.es>, UAB
Mar Cruz <mcruz at lingua.fil.ub.es>, UB
Emma Martinell <martinell at lingua.fil.ub.es>, UB
____________________________________________________________

                          Nueva página web
                                del
          Laboratorio de Lingüística Informática de la UAB
              http://seneca.uab.es/csubirats/lali.html
____________________________________________________________

    El Laboratorio de Lingüística Informática (LaLI) de la
Universidad Autónoma de Barcelona (España) os invita a visitar su
nueva página:

               http://seneca.uab.es/csubirats/lali.html

En dicha página, se describe la actividad que se está desarrollando
en el LaLI, la cual se centra básicamente en el desarrollo de:

     - bases de conocimiento lingüístico (léxico, sintáctico y
       semántico) y
     - aplicaciones informáticas

para tratar automáticamente la información de grandes corpus en
lengua española.

    Las bases de conocimiento lingüístico están integradas por:

     - un diccionario electrónico de 92.000 lemas (66,000 formas
     simples y 26,000 locuciones), que se expande automáticamente
     en un diccionario de 600.000 formas;
     - una gramática electrónica de 4.600 predicados

    El proceso de extracción de información parte de la
identificación de los elementos léxicos de un texto (tanto simples
como locuciones) junto con sus posibles ambigüedades. Para llevar a
cabo este proceso, se utiliza la información de:

     - un diccionario electrónico convertido en un transductor;
     - transductores extraídos de una gramática electrónica;

De esta forma, es posible identificar tanto los elementos léxicos
simples como los locutivos, incluyendo aquellas locuciones, como p.
ej., las locuciones verbales o las adjetivas, cuya detección
requiere información léxica y sintáctica (que, en nuestra
aplicación, procede de un diccionario y de una gramática
electrónicos respectivamente).

    La extracción del contenido informativo de las oraciones de un
texto se realiza a partir de la identificación de las relaciones
jerárquicas de predicación, es decir, a partir de la identificación
de las relaciones entre los predicados y sus argumentos. Este
procedimiento permite poner directamente en relación una jerarquía
de predicación -tal como se manifiesta en una oración- con la
información que vehicula y, por tanto, permite prescindir de
niveles intermedios, como p. ej., la 'estructura de
constituyentes':

              http://seneca.uab.es/csubirats/lali.html

----------------------------------------------------
Formatos para enviar informacion a INFOLING.
Enviar a LISTSERV at LISTSERV.REDIRIS.ES
la orden:	INFO INFOLING
----------------------------------------------------




More information about the Infoling mailing list