Tesis doctoral: PALOMAR, M. 1996. Aportaciones a la resolución de la elipsis en lenguaje natural utilizando técnicas incrementales.

Carlos Subirats Rüggeberg Carlos.Subirats at uab.es
Sun Jun 7 14:51:58 UTC 1998


INFOLING  Lista moderada de lingüística española
http://listserv.rediris.es/archives/infoling.html
Envío de información: INFOLING at listserv.rediris.es
Editor: Carlos Subirats Rüggeberg <Carlos.Subirats at uab.es>
Colaboradoras:
Paola Bentivoglio <pbentivo at reacciun.ve>, UCV
Eulalia de Bobes <ebobes at seneca.uab.es>, UAB
Mar Cruz <mcruz at lingua.fil.ub.es>, UB
Emma Martinell <martinell at lingua.fil.ub.es>, UB
______________________________________________________________

                     Tesis doctoral
    PALOMAR SANZ, Manuel J. 1996. Aportaciones a la resolución de
la elipsis en lenguaje natural utilizando técnicas incrementales
Información proporcionada por el autor: mpalomar at dlsi.ua.es
_______________________________________________________________

1. Autor:
    PALOMAR SANZ, Manuel J.

2. Título de la tesis:
   Aportaciones a la resolución de la elipsis en lenguaje natural
   utilizando técnicas incrementales

   2.1 Número de páginas: 273 págs.
   2.2 Palabras clave: Informática lingüística, tratamiento
   automático de las lenguas naturales, español

3. Fecha de lectura:
   Abril de 1996

4. Departamento en el que se ha desarrollado la tesis:
   Departamento de Sistemas Informáticos y Computación
   Universidad Politécnica de Valencia
   Valencia, España

5. Directora de la tesis:
   Lidia Moreno Boronat <lmoreno at dsic.upv.es>

6. Proyecto o línea de investigación en el que se incluye:


7. Resumen:

    El propósito principal de esta Tesis es el tratamiento y
resolución de la elipsis que se produce en la coordinación, como
uno de los problemas principales destacados en el análisis de
sentencias para la obtención de la representación de su
significado. Mucho se ha debatido en los últimos años sobre el
apropiado nivel de procesamiento del lenguaje que trate la
resolución de la elipsis. Y se ha debatido desde dos puntos de
vista; la aproximación sintáctica y la semántica. La aproximación
sintáctica (Lappin, McCord, Haík, Fiengo y May) consiste en la
reconstrucción sintáctica del constituyente incompleto a partir
de su antecedente. Mientras que la aproximación semántica
(Dalrymple, Kehler, Gawron y Peters) consiste en identificar un
significado para el constituyente incompleto y asignárselo
directamente; es decir, la información se recupera en la
representación semántica. Para esta resolución, nosotros hemos
adoptado el punto de vista semántico, donde se toma la forma
lógica del antecedente para la reconstrucción del constituyente
incompleto o elidido. Consideramos que no es necesario una
reconstrucción sintáctica de los elementos elididos, ya que la
reconstrucción semántica proporciona los mecanismos adecuados
para, una vez identificado el antecedente del constituyente
elidido, asignarle su forma lógica, por lo que resuelve de forma
más eficiente el problema.

    El problema de la resolución de la elipsis lo hemos dividido
en dos tareas:

    (1) determinar la estructura paralela entre el constituyente
incompleto y su antecedente;
    (2) determinar la formación de la relación implícita.

La división del problema de la elipsis en dos partes permite una
mejor descripción de la formación de la relación y una mejor
caracterización del problema de determinación del paralelismo.
Por lo que desde nuestro punto de vista, para determinar el
paralelismo es necesario criterios sintáctico-semánticos y,
posteriormente, para la formación de la relación, se pueden
adoptar criterios semánticos. Con ello, aportamos un nuevo método
de resolución que incorpora una adaptación de recientes trabajos
sobre la elipsis, donde resalta la idea de estructuras paralelas,
pero mientras estas aproximaciones acentúan el paralelismo
semántico, nosotros usamos tanto el paralelismo sintáctico como
el semántico.

    Este nuevo método esta basado en las técnicas incrementales
de evaluación de programas Datalog como herramienta para la
definición e implementación de gramáticas de contexto libre; y
está  desarrollado mediante un nuevo tipo de Gramáticas de
Cláusulas Definidas (DCGs), las Gramáticas Datalog(DLG), basadas
en la teoría de bases de datos. El nuevo formalismo que
presentamos es una extensión de las Gramáticas Datalog,
presentadas por V.Dahl, P.Tarau, L.Moreno y M.Palomar, el cual
mejora la eficiencia de las tradicionales Gramáticas de Cláusulas
Definidas (DCG) mediante apropiados mecanismos de compilación
(como por ejemplo la resolución-OLDT). Esta extensión mejora el
tratamiento y resolución  de las estructuras coordinadas y
plantea, por primera vez, una implementación en Prolog de tal
gramática, utilizando el algoritmo de evaluación semi-naive, que
nos permite “congelar” el proceso de análisis de las oraciones
para poderlo tratar metagramaticalmente.

    Por último, se adapta el mecanismo de comprobación semántica
de tipos (IRSAS) a nuestro método, que permite resolver gran
número de casos de coordinación y de elipsis.


                          Índice:
1.  Introducción
2.  Estudio Lingüístico
3.  Gramáticas y Analizadores
4.  Elipsis
5.  Fundamentos teóricos
6.  Gramáticas Datalog extendidas
7.  Resolución de la coordinación y de la elipsis
8.  Implementación de las gramáticas Datalog extendidas
9.  Secuencia de teoremas
10. Comportamiento del sistema
11. Conclusiones y trabajos futuros
12. Bibliografía
13. Apéndices


8. Dirección de correo-e del autor:
   mpalomar at dlsi.ua.es

9. Posibilidad de obtener un ejemplar de la tesis:
   Biblioteca de la Universidad Politécnica de Valencia

----------------------------------------------------
Archivos de INFOLING: http://listserv.rediris.es/archives/infoling.html
------------------------------------------------------




More information about the Infoling mailing list