Información sobre tesina: BERMEJO, Felisa. 1998. Un desambiguador morfológico del español.
Carlos Subirats Rüggeberg
Carlos.Subirats at uab.es
Mon Jul 13 09:28:43 UTC 1998
INFOLING Lista moderada de lingüística española
http://listserv.rediris.es/archives/infoling.html
Envío de información: INFOLING at listserv.rediris.es
Editor: Carlos Subirats Rüggeberg <Carlos.Subirats at uab.es>
Colaboradoras:
Paola Bentivoglio <pbentivo at reacciun.ve>, UCV
Eulalia de Bobes <ebobes at seneca.uab.es>, UAB
Mar Cruz <mcruz at lingua.fil.ub.es>, UB
Emma Martinell <martinell at lingua.fil.ub.es>, UB
____________________________________________________________
Información sobre tesina
BERMEJO, Felisa. 1998. Un desambiguador morfológico del
español. Aplicación a un corpus en soporte electrónico de
textos para la enseñanza de español.
Información proporcionada por:
Felisa Bermejo <bermejo at cisi.unito.it>
____________________________________________________________
1. Autora:
Felisa BERMEJO CALLEJA
2. Título:
Un desambiguador morfológico del español. Aplicación a
un corpus en soporte electrónico de textos para la
enseñanza de español.
3. Fecha de lectura:
3 de julio de 1998
4. Departamento:
Istituto di spagnolo
Facolta di Lettere e Filosofia
Universita degli Studi di Torino
5. Directora:
Carla MARELLO
6. Proyecto o linea de investigación:
7. Resumen:
El desambiguador está constituido por un módulo de
software y una gramática de desambiguación, que constituye
el objeto específico de la tesina. La gramática de
desambiguación es un conjunto de reglas que comprende, por
una parte, instrucciones del sistema operativo informático
y, por otra, una serie de elementos de carácter
lingüístico. Los elementos lingüísticos están representados
por signos preestablecidos en el sistema de anotación y
representación; son los atributos: cat (categoría), gender
(género), nb (número), etc. y los tipos o características:
n (nombre), v (verbo), adj (adjetivo), adv (adverbio), etc.
Las flexiones consideradas son género y número para nombres
y adjetivos y conjugación para los verbos que incluye
pronombres enclíticos.
El objetivo de las reglas es desambiguar las unidades
léxicas del discurso. Se cuenta con una Base de Datos
constituida por un diccionario de español, cuyas entradas
(lemas) poseen una categoría (atributo) y determinadas
características (tipos).
El desambiguador consiste en un conjunto de reglas que
instruyen a la máquina para que seleccione, entre las
diferentes clases de palabras, la que es correcta en una
estructura sintáctica dada. Las reglas deben respetar
los principios de máxima aplicabilidad y máxima eficacia en
la desambiguación, que comprende además la corrección de la
interpretación gramatical. Cada regla recoge una secuencia
formada por uno o más elementos lingüísticos. Si la
secuencia es breve, su aplicabilidad aumenta, pero
disminuye su eficacia desambiguadora y viceversa.
Los factores e instrumentos fundamentales para la
desambiguación son: la jerarquización en niveles, el valor
numérico, la longitud de la secuencia en la regla, el orden
de sus componentes, la capacidad desambiguadora de ciertos
elementos y la concordancia.
El conjunto de las reglas y cada una de ellas
constituye una representación de la información que
conlleva una expresión lingüística. Previamente ha
sido necesario llevar a cabo un pormenorizado estudio y
análisis de fenómenos lingüísticos, centrados
principalmente en las partes del discurso, para llegar a
una descripción sistemática de su comportamiento y
combinatoria, como paso previo, además de necesario, para
la formulación de las reglas en cumplimiento de los
principios de corrección, aplicabilidad y eficacia. Así
pues, es una descripción cuya utilidad presupone un punto
de vista nuevo: su utilización para un desambiguador
morfológico.
El corpus elegido presenta varias ventajas para su
utilización en las pruebas de desambiguación. En primer
lugar la lengua utilizada es estándar, común a las
diferentes realidades lingüísticas hispanas, tanto
diatópicas como diastráticas. En segundo lugar ofrece una
gran variedad de tipos de texto: diálogos, narraciones,
descripciones, comentarios, noticias periodísticas, etc. En
definitiva, es un corpus con un muestrario equilibrado y
con un componente lingüístico estándar.
Índice
Introducción
1ª parte.
1. Medios y finalidad.
1.1. Ambiente informático de la tesis.
1.2. Contexto aplicativo de la gramática de
desambiguación del español.
2. Estructura y sistema operativos.
2.1. Unificación, matching, representación y anotación.
2.1.1. La unificación.
2.1.2. El matching.
2.1.3. La representación y la anotación.
2.2. Descripción esencial de la estructura informática
del desambiguador.
3. Anotación y formalismo.
3.1. Atributos y tipos.
3.2. Símbolos empleados en la formulación de las reglas.
4. Proceso de desambiguación.
4.1. Descripción analítica del proceso de
desambiguación.
4.2. Factores de desambiguación.
4.2.1. Niveles.
4.2.2. El orden.
4.2.3. La concordancia.
4.2.4. Elementos con capacidad de desambiguación.
5. Selección y preparación del corpus.
5.1. Panorama editorial de publicaciones de E/LE.
5.1.1. Métodos y libros publicados en España.
5.1.2. Métodos y libros publicados en Italia.
5.2. Datos y criterios para la selección del corpus.
5.3. Selección de los métodos.
5.4. Estructura y organización de los contenidos de cada
método.
5.4.1. Ven 1. Libro del alumno.
5.4.2. Claro que sí. Volumen 1.
5.5. Lectura con el escáner. Preparación.
6. La Base de Datos y el Diccionario de la Real Academia
Española.
6.1. Sustantivo y nombre, como términos.
6.2. Diccionario de la Lengua Española de la Real
Academia Española (DRAE).
6.3. Categorías de la Base de Datos.
6.4. Artículo indeterminado.
7. Criterios generales de disposición de las reglas y su
jerarquización.
7.1. Categorías de la Base de Datos (diccionario).
7.2. Criterio basado en la cantidad de componentes
de la secuencia.
7.3. Criterio basado en otorgar un valor numérico.
7.4. Criterio basado en la capacidad de desambiguación
de ciertas categorías.
7.5. Aplicación conjunta.
7.6. La secuencia tipo se basa en la estructura del
sintagma nominal.
8. Grupo nominal y grupo verbal.
8.1. Fundamento de la estructura del desambiguador.
8.2. Orden de los elementos dentro de la secuencia.
8.3. Grupo nominal.
8.4. Grupo verbal.
8.5. Reglas con cinco elementos.
8.6. Jerarquización de las reglas correspondientes a
los grupos nominal y verbal.
9. El adjetivo.
9.1. Adjetivo calificativo.
9.2. La posición del adjetivo calificativo y el
desambiguador.
9.3. Posición del adjetivo calificativo.
9.3.1. Función del adjetivo calificativo pospuesto.
9.3.2. Función del adjetivo calificativo
antepuesto.
9.3.3. Frases lexicalizadas.
9.3.4. Preferencia de colocación del adjetivo
calificativo con respecto al nombre.
9.3.5. Cambio de significado en función de su
posición con respecto al nombre.
9.4. Criterio de frecuencia acerca de la posición del
adjetivo calificativo con respecto al nombre.
9.5. Reglas para la secuencia nombre + adjetivo.
9.6. Reglas para la secuencia adjetivo + nombre.
9.7. Adjetivos calificativos combinados con otras
categorías.
9.8. Adverbios que eventualmente acompañan al adjetivo
calificativo.
10. Determinantes.
10.1. Determinantes.
10.2. Artículos.
10.3. Adjetivos determinativos.
10.4. Características generales de los adjetivos
determinativos.
10.5. Reglas generales.
10.6. Posición y combinatoria.
10.6.1. Demostrativos.
10.6.2. Posesivos.
10.6.3. Clasificación según la combinatoria
entre determinantes.
10.6.4. Con determinante antepuesto.
10.6.5. Mismo.
10.6.6. Demás.
10.6.7. Otro.
10.6.8. Todo.
10.7. Más y menos.
10.7.1. Como adverbios son parte esencial
de la comparación.
10.7.2. Adjetivos seguidos de nombre o
adverbios seguidos de adjetivos.
10.7.3. Como adverbios, naturalmente,
también acompañan al verbo.
10.7.4. Como nombre.
10.7.5. Como pronombre.
10.7.6. En relación con los números.
10.8. Casos específicos.
10.8.1. Este, ese, poco.
10.8.2. Uno, una, unos, unas.
11. El artículo lo.
11.1. Caracterización del artículo lo.
11.2. La sustantivación.
11.2.1. El fenómeno de la sustantivación.
11.2.2. La categoría de artículo.
11.3. Reglas para el artículo lo.
11.3.1. Aclaraciones previas.
11.3.2. Lo seguido de adjetivo.
11.3.2.1. Lo intensivo.
11.3.2.2. Lo + adjetivo + de.
11.3.3. El artículo lo en las comparativas de
superioridad e inferioridad.
11.3.4. El artículo lo en las proposiciones de
relativo.
11.3.5. Lo y los adjetivos determinativos.
12. Artículo el seguido de sustantivo femenino.
12.1. Regla general.
12.2. Sustantivos de género femenino precedido del
artículo el.
12.3. Regla especial para el más sustantivos de género
femenino.
12.4. La asignación del género.
12.5. Un seguido de sustantivo femenino.
13. Preposiciones.
13.1. Inventario de preposiciones.
13.2. Preposiciones. Creación y disposición de las
reglas.
13.2.1. Combinatoria.
13.2.2. La preposición y el adjetivo.
13.2.3. Disposición jerárquica.
13.2.4. Preposición + que.
13.3. Preposiciones y cláusulas de relativo.
13.4. Preposiciones en interrogativas, exclamativas y
comparativas.
13.5. Preposiciones que desambiguan otros elementos.
13.5.1. La preposición por de la pasiva.
13.5.2. La preposición por y las subordinadas
concesivas.
13.5.3. Las preposiciones y el adverbio sí.
13.5.4. La preposición de y los pronombres
indefinidos.
13.5.5. Un caso especial.
13.6. Las preposiciones y los nombres de letras.
13.7. Análisis de como.
14. Locuciones e interjecciones.
14.1. Locuciones.
14.2. Interjecciones.
15. Tiempos compuestos.
15.1. El verbo auxiliar de los tiempos compuestos es
haber.
16. La pasiva y los verbos copulativos.
16.1. La pasiva.
16.2. Verbos copulativos.
17. El imperativo.
17.1. Regla excluyente.
17.2. Reglas restrictivas.
17.3. Reglas motivadas por el tipo de corpus.
17.4. Formas irregulares de tú.
18. Cláusulas de relativo.
18.1. Inventario de relativos.
18.2. Criterios y disposición de las reglas.
18.3. El relativo que y cuanto.
19. La conjunción que.
19.1. Como pronombre relativo.
19.2. Como conjunción.
20. Comparativas.
20.1. Reglas.
20.2. La comparación.
20.3. Superlativos relativos.
20.3.1. Procedimiento.
20.3.2. Cinco elementos en la regla.
20.4. Más y menos.
20.5. Cuanto y tanto.
20.5.1. Tanto.
20.5.2. Cuanto.
20.5.3. Tanto y cuanto.
20.6. Tan y muy.
21. Interrogativas y exclamativas.
21.1. Interrogativas.
21.2. Exclamativas.
21.2.1. Reglas de más de tres elementos.
21.2.2. Reglas de tres elementos.
21.2.3. Reglas de dos elementos.
21.2.4. Criterios.
21.3. Interjecciones.
2ª parte.
Textos extraídos del corpus.
Ejemplos de la aplicación del desambiguador morfológico del
español.
3ª parte.
Reglas del desambiguador morfológico del español.
Bibliografía.
8. Dirección postal de la autora:
Felisa Bermejo
Corso Casale, 359
10132 Torino
ITALIA
correo-e: bermejo at cisi.unito.it
9. Posibilidad de obtener un ejemplar:
Contactar con la autora.
----------------------------------------------------
Normas para el correcto uso del correo electrónico:
http://www.rediris.es/mail/estilo.html
----------------------------------------------------
More information about the Infoling
mailing list