Información sobre tesina: BERMEJO, Felisa. 1998. Un desambiguador morfológico del español.

Carlos Subirats Rüggeberg Carlos.Subirats at uab.es
Mon Jul 13 09:28:43 UTC 1998


INFOLING  Lista moderada de lingüística española
http://listserv.rediris.es/archives/infoling.html
Envío de información: INFOLING at listserv.rediris.es
Editor: Carlos Subirats Rüggeberg <Carlos.Subirats at uab.es>
Colaboradoras:
Paola Bentivoglio <pbentivo at reacciun.ve>, UCV
Eulalia de Bobes <ebobes at seneca.uab.es>, UAB
Mar Cruz <mcruz at lingua.fil.ub.es>, UB
Emma Martinell <martinell at lingua.fil.ub.es>, UB
____________________________________________________________

                  Información sobre tesina
    BERMEJO, Felisa. 1998. Un desambiguador morfológico del
español. Aplicación a un corpus en soporte electrónico de
textos para la enseñanza de español.
               Información proporcionada por:
           Felisa Bermejo <bermejo at cisi.unito.it>
____________________________________________________________

1. Autora:
   Felisa BERMEJO CALLEJA

2. Título:

    Un desambiguador morfológico del español. Aplicación a
    un corpus en soporte electrónico de textos para la
    enseñanza de español.

3. Fecha de lectura:
   3 de julio de 1998

4. Departamento:
   Istituto di spagnolo
   Facolta di Lettere e Filosofia
   Universita degli Studi di Torino

5. Directora:
   Carla MARELLO

6. Proyecto o linea de investigación:


7. Resumen:

    El desambiguador está constituido por un módulo de
software y una gramática de desambiguación, que constituye
el objeto específico de la tesina. La gramática de
desambiguación es un conjunto de reglas que comprende, por
una parte, instrucciones del sistema operativo informático
y, por otra, una serie de elementos de carácter
lingüístico. Los elementos lingüísticos están representados
por signos preestablecidos en el sistema de anotación y
representación; son los atributos: cat (categoría), gender
(género), nb (número), etc. y los tipos o características:
n (nombre), v (verbo), adj (adjetivo), adv (adverbio), etc.
Las flexiones consideradas son género y número para nombres
y adjetivos y conjugación para los verbos que incluye
pronombres enclíticos.

    El objetivo de las reglas es desambiguar las unidades
léxicas del discurso. Se cuenta con una Base de Datos
constituida por un diccionario de español, cuyas entradas
(lemas) poseen una categoría (atributo) y determinadas
características (tipos).

    El desambiguador consiste en un conjunto de reglas que
instruyen a la máquina para que seleccione, entre las
diferentes clases de palabras, la que es correcta en una
estructura sintáctica dada. Las reglas deben respetar
los principios de máxima aplicabilidad y máxima eficacia en
la desambiguación, que comprende además la corrección de la
interpretación gramatical. Cada regla recoge una secuencia
formada por uno o más elementos lingüísticos. Si la
secuencia es breve, su aplicabilidad aumenta, pero
disminuye su eficacia desambiguadora y viceversa.

    Los factores e  instrumentos fundamentales para la
desambiguación son: la jerarquización en niveles, el valor
numérico, la longitud de la secuencia en la regla, el orden
de sus componentes, la capacidad desambiguadora de ciertos
elementos y la concordancia.

    El conjunto de las reglas y cada una de ellas
constituye una representación de la información que
conlleva una expresión lingüística. Previamente ha
sido necesario llevar a cabo un pormenorizado estudio y
análisis de fenómenos lingüísticos, centrados
principalmente en las partes del discurso, para llegar a
una descripción sistemática de su comportamiento y
combinatoria, como paso previo, además de necesario, para
la formulación de las reglas en cumplimiento de los
principios de corrección, aplicabilidad y eficacia. Así
pues, es una descripción cuya utilidad presupone un punto
de vista nuevo: su utilización para un desambiguador
morfológico.

    El corpus elegido presenta varias ventajas para su
utilización en las pruebas de desambiguación. En primer
lugar la lengua utilizada es estándar, común a las
diferentes realidades lingüísticas hispanas, tanto
diatópicas como diastráticas. En segundo lugar ofrece una
gran variedad de tipos de texto: diálogos, narraciones,
descripciones, comentarios, noticias periodísticas, etc. En
definitiva, es un corpus con un muestrario equilibrado y
con un componente lingüístico estándar.


                           Índice

Introducción

1ª parte.

1. Medios y finalidad.
   1.1. Ambiente informático de la tesis.
   1.2. Contexto aplicativo de la gramática de
        desambiguación del español.

2. Estructura y sistema operativos.
   2.1. Unificación, matching, representación y anotación.
        2.1.1. La unificación.
        2.1.2. El matching.
        2.1.3. La representación y la anotación.
   2.2. Descripción esencial de la estructura informática
        del desambiguador.

3. Anotación y formalismo.
   3.1. Atributos y tipos.
   3.2. Símbolos empleados en la formulación de las reglas.

4. Proceso de desambiguación.
   4.1. Descripción analítica del proceso de
        desambiguación.
   4.2. Factores de desambiguación.
        4.2.1. Niveles.
        4.2.2. El orden.
        4.2.3. La concordancia.
        4.2.4. Elementos con capacidad de desambiguación.

5. Selección y preparación del corpus.
   5.1. Panorama editorial de publicaciones de E/LE.
        5.1.1. Métodos y libros publicados en España.
        5.1.2. Métodos y libros publicados en Italia.
   5.2. Datos y criterios para la selección del corpus.
   5.3. Selección de los métodos.
   5.4. Estructura y organización de los contenidos de cada
        método.
        5.4.1. Ven 1. Libro del alumno.
        5.4.2. Claro que sí. Volumen 1.
   5.5. Lectura con el escáner. Preparación.

6. La Base de Datos y el Diccionario de la Real Academia
   Española.
   6.1. Sustantivo y nombre, como términos.
   6.2. Diccionario de la Lengua Española de la Real
        Academia Española (DRAE).
   6.3. Categorías de la Base de Datos.
   6.4. Artículo indeterminado.

7. Criterios generales de disposición de las reglas y su
   jerarquización.
   7.1. Categorías de la Base de Datos (diccionario).
   7.2. Criterio basado en la cantidad de componentes
        de la secuencia.
   7.3. Criterio basado en otorgar un valor numérico.
   7.4. Criterio basado en la capacidad de desambiguación
        de ciertas categorías.
   7.5. Aplicación conjunta.
   7.6. La secuencia tipo se basa en la estructura del
        sintagma nominal.

8. Grupo nominal y grupo verbal.
   8.1. Fundamento de la estructura del desambiguador.
   8.2. Orden de los elementos dentro de la secuencia.
   8.3. Grupo nominal.
   8.4. Grupo verbal.
   8.5. Reglas con cinco elementos.
   8.6. Jerarquización de las reglas correspondientes a
        los grupos nominal y verbal.

9. El adjetivo.
   9.1. Adjetivo calificativo.
   9.2. La posición del adjetivo calificativo y el
        desambiguador.
   9.3. Posición del adjetivo calificativo.
        9.3.1. Función del adjetivo calificativo pospuesto.
        9.3.2. Función del adjetivo calificativo
               antepuesto.
        9.3.3. Frases lexicalizadas.
        9.3.4. Preferencia de colocación del adjetivo
               calificativo con respecto al nombre.
        9.3.5. Cambio de significado en función de su
               posición con respecto al nombre.
   9.4. Criterio de frecuencia acerca de la posición del
        adjetivo calificativo con respecto al nombre.
   9.5. Reglas para la secuencia nombre + adjetivo.
   9.6. Reglas para la secuencia adjetivo + nombre.
   9.7. Adjetivos calificativos combinados con otras
        categorías.
   9.8. Adverbios que eventualmente acompañan al adjetivo
        calificativo.

10. Determinantes.
    10.1. Determinantes.
    10.2. Artículos.
    10.3. Adjetivos determinativos.
    10.4. Características generales de los adjetivos
          determinativos.
    10.5. Reglas generales.
    10.6. Posición y combinatoria.
          10.6.1. Demostrativos.
          10.6.2. Posesivos.
          10.6.3. Clasificación según la combinatoria
                  entre determinantes.
          10.6.4. Con determinante antepuesto.
          10.6.5. Mismo.
          10.6.6. Demás.
          10.6.7. Otro.
          10.6.8. Todo.
    10.7. Más y menos.
          10.7.1. Como adverbios son parte esencial
                  de la comparación.
          10.7.2. Adjetivos seguidos de nombre o
                  adverbios seguidos de adjetivos.
          10.7.3. Como adverbios, naturalmente,
                  también acompañan al verbo.
          10.7.4. Como nombre.
          10.7.5. Como pronombre.
                10.7.6. En relación con los números.
    10.8. Casos específicos.
          10.8.1. Este, ese, poco.
          10.8.2. Uno, una, unos, unas.

11. El artículo lo.
    11.1. Caracterización del artículo lo.
    11.2. La sustantivación.
          11.2.1. El fenómeno de la sustantivación.
          11.2.2. La categoría de artículo.
    11.3. Reglas para el artículo lo.
          11.3.1. Aclaraciones previas.
          11.3.2. Lo seguido de adjetivo.
                  11.3.2.1. Lo intensivo.
                  11.3.2.2. Lo + adjetivo + de.
          11.3.3. El artículo lo en las comparativas de
                  superioridad e inferioridad.
          11.3.4. El artículo lo en las proposiciones de
                  relativo.
          11.3.5. Lo y los adjetivos determinativos.

12. Artículo el seguido de sustantivo femenino.
    12.1. Regla general.
    12.2. Sustantivos de género femenino precedido del
          artículo el.
    12.3. Regla especial para el más sustantivos de género
          femenino.
    12.4. La asignación del género.
    12.5. Un seguido de sustantivo femenino.

13. Preposiciones.
    13.1. Inventario de preposiciones.
    13.2. Preposiciones. Creación y disposición de las
          reglas.
          13.2.1. Combinatoria.
          13.2.2. La preposición y el adjetivo.
          13.2.3. Disposición jerárquica.
          13.2.4. Preposición + que.
    13.3. Preposiciones y cláusulas de relativo.
    13.4. Preposiciones en interrogativas, exclamativas y
          comparativas.
    13.5. Preposiciones que desambiguan otros elementos.
          13.5.1. La preposición por de la pasiva.
          13.5.2. La preposición por y las subordinadas
                  concesivas.
          13.5.3. Las preposiciones y el adverbio sí.
          13.5.4. La preposición de y los pronombres
                  indefinidos.
          13.5.5. Un caso especial.
    13.6. Las preposiciones y los nombres de letras.
    13.7. Análisis de como.

14. Locuciones e interjecciones.
    14.1. Locuciones.
    14.2. Interjecciones.

15. Tiempos compuestos.
    15.1. El verbo auxiliar de los tiempos compuestos es
          haber.

16. La pasiva y los verbos copulativos.
    16.1. La pasiva.
    16.2. Verbos copulativos.

17. El imperativo.
    17.1. Regla excluyente.
    17.2. Reglas restrictivas.
    17.3. Reglas motivadas por el tipo de corpus.
    17.4. Formas irregulares de tú.

18. Cláusulas de relativo.
    18.1. Inventario de relativos.
    18.2. Criterios y disposición de las reglas.
    18.3. El relativo que y cuanto.

19. La conjunción que.
    19.1. Como pronombre relativo.
    19.2. Como conjunción.

20. Comparativas.
    20.1. Reglas.
    20.2. La comparación.
    20.3. Superlativos relativos.
          20.3.1. Procedimiento.
          20.3.2. Cinco elementos en la regla.
    20.4. Más y menos.
    20.5. Cuanto y tanto.
          20.5.1. Tanto.
          20.5.2. Cuanto.
          20.5.3. Tanto y cuanto.
    20.6. Tan  y muy.

21. Interrogativas y exclamativas.
    21.1. Interrogativas.
    21.2. Exclamativas.
          21.2.1. Reglas de más de tres elementos.
          21.2.2. Reglas de tres elementos.
          21.2.3. Reglas de dos elementos.
          21.2.4. Criterios.
    21.3. Interjecciones.


2ª parte.

Textos extraídos del corpus.
Ejemplos de la aplicación del desambiguador morfológico del
español.

3ª parte.

Reglas del desambiguador morfológico del español.

Bibliografía.



8.  Dirección postal de la autora:

Felisa Bermejo
Corso Casale, 359
10132 Torino
ITALIA
correo-e: bermejo at cisi.unito.it

9. Posibilidad de obtener un ejemplar:
   Contactar con la autora.

----------------------------------------------------
Normas para el correcto uso del correo electrónico:
		http://www.rediris.es/mail/estilo.html
----------------------------------------------------




More information about the Infoling mailing list