Nueva página del Laboratorio de Lingüística Informática de la UAB
Carlos Subirats Rüggeberg
Carlos.Subirats at UAB.ES
Mon Dec 7 13:05:17 UTC 1998
INFOLING Lista moderada de lingüística española
http://listserv.rediris.es/archives/infoling.html
Envío de información: INFOLING at listserv.rediris.es
Editor: Carlos Subirats Rüggeberg <Carlos.Subirats at uab.es>
Colaboradoras:
Paola Bentivoglio <pbentivo at reacciun.ve>, UCV
Eulalia de Bobes <ebobes at seneca.uab.es>, UAB
Mar Cruz <mcruz at lingua.fil.ub.es>, UB
Emma Martinell <martinell at lingua.fil.ub.es>, UB
____________________________________________________________
Nueva página web
del
Laboratorio de Lingüística Informática de la UAB
http://seneca.uab.es/csubirats/lali.html
____________________________________________________________
El Laboratorio de Lingüística Informática (LaLI) de la
Universidad Autónoma de Barcelona (España) os invita a visitar su
nueva página:
http://seneca.uab.es/csubirats/lali.html
En dicha página, se describe la actividad que se está desarrollando
en el LaLI, la cual se centra básicamente en el desarrollo de:
- bases de conocimiento lingüístico (léxico, sintáctico y
semántico) y
- aplicaciones informáticas
para tratar automáticamente la información de grandes corpus en
lengua española.
Las bases de conocimiento lingüístico están integradas por:
- un diccionario electrónico de 92.000 lemas (66,000 formas
simples y 26,000 locuciones), que se expande automáticamente
en un diccionario de 600.000 formas;
- una gramática electrónica de 4.600 predicados
El proceso de extracción de información parte de la
identificación de los elementos léxicos de un texto (tanto simples
como locuciones) junto con sus posibles ambigüedades. Para llevar a
cabo este proceso, se utiliza la información de:
- un diccionario electrónico convertido en un transductor;
- transductores extraídos de una gramática electrónica;
De esta forma, es posible identificar tanto los elementos léxicos
simples como los locutivos, incluyendo aquellas locuciones, como p.
ej., las locuciones verbales o las adjetivas, cuya detección
requiere información léxica y sintáctica (que, en nuestra
aplicación, procede de un diccionario y de una gramática
electrónicos respectivamente).
La extracción del contenido informativo de las oraciones de un
texto se realiza a partir de la identificación de las relaciones
jerárquicas de predicación, es decir, a partir de la identificación
de las relaciones entre los predicados y sus argumentos. Este
procedimiento permite poner directamente en relación una jerarquía
de predicación -tal como se manifiesta en una oración- con la
información que vehicula y, por tanto, permite prescindir de
niveles intermedios, como p. ej., la 'estructura de
constituyentes':
http://seneca.uab.es/csubirats/lali.html
----------------------------------------------------
Formatos para enviar informacion a INFOLING.
Enviar a LISTSERV at LISTSERV.REDIRIS.ES
la orden: INFO INFOLING
----------------------------------------------------
More information about the Infoling
mailing list