Resumen de tesis doctoral: Moreno Ortiz, A. Diseño e implementación de un lexicón computacional para lexicografía y traducción automática. Departamento de Filología Inglesa, Universidad de Córdoba (=?iso-8859-1?Q?Espa=F1a?=)
Carlos Subirats-Ruggeberg
subirats at ICSI.BERKELEY.EDU
Fri Jul 14 17:18:53 UTC 2000
INFOLING. Lista moderada de lingüística española (ISSN: 1576-3404)
España: http://listserv.rediris.es/archives/infoling.html
EE.UU: http://listserv.linguistlist.org/archives/infoling.html
ESTUDIOS DE LINGÜÍSTICA ESPAÑOLA http://elies.rediris.es/
Envío de información: mailto:infoling-request at listserv.rediris.es
Editores: Mar Cruz Piñol, U. Barcelona, mailto:mcruz at fil.ub.es
Carlos Subirats Rüggeberg, UAB, mailto:Carlos.Subirats at uab.es
Cursos y congresos: Laura Canós, UB, mailto:lcanos at fil.ub.es
Ofertas de trabajo e información de otras listas: Eulàlia de Bobes, UAB,
mailto:Eulalia.deBobes at uab.es, Lídia Moya, UAB, mailto:Lidia.Moya at uab.es
Comité de redacción: http://elies.rediris.es/#Comite_de_redaccion
____________________________________________________________
Star Servicios Lingüísticos patrocinador de Infoling y ELiEs.
Nuevas tecnologías aplicadas a la traducción y la terminología
multilingüe. Especialistas en la traducción de documentación técnica al
español: http://www.star-group.net/star-group/stbar/principal.html
____________________________________________________________
Resumen de tesis doctoral:
Moreno Ortiz, Antonio. 1998. Diseño e implementación de un lexicón
computacional para lexicografía y traducción automática. Departamento de
Filología Inglesa, Universidad de Córdoba (España):
http://webdeptos.uma.es/filifa/personal/amoreno/research/pubs.htm
____________________________________________________________
1. Autor:
Moreno Ortiz, Antonio
2. Título de la tesis:
Diseño e implementación de un lexicón computacional para
lexicografía y traducción automática
2.1 Número de páginas: 773 páginas
2.1 Palabras clave: lexicografía computacional, traducción
automática, estructuración concepual, ontologías
3. Fecha de lectura:
11 de febrero de 1998
4. Departamento, centro o laboratorio en el que se ha
desarrollado la tesis:
Departamento de Filología Inglesa
Universidad de Córdoba
España
5. Directora de la tesis:
Dra. Pamela B. Faber
6. Proyecto o línea de investigación en el que se incluye:
Desarrollo de un lexicón multilingüe, multifuncional y
reutilizable
7. Resumen:
El objetivo fundamental de esta tesis doctoral es la implementación
de un lexicón multilingüe basado en el modelo de análisis
lexemático-funcional. Como objetivo fundamental, se pretende la creación
de un recurso léxico capaz de dar soporte a aplicaciones de
procesamiento del lenguaje natural avanzadas, especialmente la
traducción automática.
Tras analizar los modelos lexicón computacional propuestos hasta la
fecha, así como el concepto de lexicón como recurso lingüístico, se
evalúan los distintos enfoques de traducción automática. En esta tesis
se defiende el modelo basado en el conocimiento, para el que se hace
necesario la utilización de un recurso conceptual, independiente de la
lengua, que actúa como punto de encuentro entre los disintos lexicones
monolingües entre los que se pretende traducir.
Por lo tanto se propone un modelo de lexicón que, aun siendo
independiente, se basa en una ontología de conceptos, la cual se
propone, además, como solución a algunos problemas que el modelo
lingüístico presenta en este tipo de aplicaciones. En los capítulos
finales, tras mostrar los posibles formalismos de implementación, se
describe el diseño del lexicón mediante diagramas de entidad-relación,
al estar implementado en una base de datos relacional, así como la
implementación en un sublenguaje Prolog de la ontología de conceptos, y
el modo en que ambos recursos se integran.
Para validar este diseño se emplean los campos léxicos de los verbos
de sonido en español e inglés, tanto a nivel de lexicón como en sus
correspondientes conceptuales en la ontología.
Índice
1 Introducción
1.1 El modelo lingüístico/lexicográfico
1.2 Adecuación lexicográfica y computacional del modelo
2 El lexicón: concepto interdisciplinar
2.1 El lexicón en el ámbito de la psicolingüística: el lexicón
mental
2.2 El lexicón en el procesamiento de lenguaje natural: la
lexicografía computacional
2.2.1 Sentando las Bases para la Construcción de Lexicones
Automatizados en Europa: La Conferencia de Marina di
Grosseto
2.2.2 Nuevas tendencias en los sistemas de NLP: El concepto
de REUTILIZACIÓN
2.3 Adquisición de conocimiento léxico
2.4 Diseño e implementación de algunos lexicones
computacionales
2.4.1 Acquilex LKB
2.4.2 WordNet
2.4.3 IITLEX
2.4.4 COBUILD
2.5 Conclusiones y discusión
3 El lexicón en la Traducción Automática
3.1 Metodologías básicas empleadas en la TA
3.1.1 El proceso de análisis
3.1.2 El análisis sintáctico y el análisis semántico
3.2 Enfoques tradicionales a la Traducción Automática
3.2.1 Arquitectura directa o transformer
3.2.2 Arquitectura de Transferencia
3.2.3 Sistemas basados en interlingua
3.2.4 Systran
3.2.5 Metal
3.2.6 Eurotra
3.2.7 Multilex
3.2.8 Acquilex
3.3 Enfoques modernos a la Traducción Automática
3.3.1 Enfoques empíricos
3.3.2 Sistemas basados en el conocimiento
3.3.3 KBMT-89
3.3.4 KANT
3.3.5 Pangloss
3.3.6 Mikrokosmos
3.4 Conclusiones y discusión
4 Representación del Conocimiento y Representación Léxica
4.1 Bases de datos y bases de conocimiento
4.1.1 Contenidos: Conocimiento. Información. Datos.
4.1.2 Características y objetivos
4.1.2.1 Bases de datos
4.1.2.2 Bases de conocimiento
4.1.3 Definiciones formales y arquitecturas
4.1.3.1 Bases de datos
4.1.3.2 Bases de conocimiento
4.2 Bases de datos: Modelos de datos
4.2.1 El enfoque jerárquico
4.2.2 El enfoque de red
4.2.3 El enfoque relacional
4.2.3.1 Conceptos básicos: tuplas, relaciones, atributos
4.2.3.2 Claves primarias
4.2.3.3 Interrelaciones. Claves ajenas
4.2.3.4 Integridad Relacional
4.2.3.5 Formas normales
4.2.3.6 Lenguajes relacionales. Consultas
4.2.3.7 Ventajas e inconvenientes del modelo relacional
4.3 Bases de conocimiento: Esquemas de Representación
4.3.1 Esquemas lógicos
4.3.2 Esquemas de redes semánticas
4.3.2.1 Redes IS-A
4.3.2.2 Grafos conceptuales
4.3.2.3 Esquemas de marcos
4.4 Representación léxica específica
4.4.1 Estructuras de rasgos
4.4.2 Tipificación de estructuras de rasgos
4.4.3 PATR
4.4.4 DATR
4.4.5 ALE
4.5 Conclusiones y discusión
5 Diseño e implementación
5.1 Modelado conceptual de bases de datos relacionales: El
modelo E/R
5.2 Esquema conceptual de la base de datos
5.3 El interfaz de usuario
5.4 La ontología
5.5 El campo léxico de los verbos de sonido en la LDB y la
ontología
5.6 Conclusiones y discusión
6 Conclusiones finales
Referencias
Apéndice 1: El campo léxico de sonido (Inglés)
Apéndice 2: El campo léxico de sonido (Español)
8.Dirección postal, fax o correo-e del autor:
Antonio Moreno Ortiz mailto:amo at uma.es
Departamento de Filología Inglesa
Facultad de Filosofía y Letras
Universidad de Málaga
Campus de Teatinos
29071 Málaga
ESPAÑA
9. Posibilidad de obtener un ejemplar de la tesis:
En formato Postscript desde:
http://webdeptos.uma.es/filifa/personal/amoreno/research/pubs.htm
Próximamente en formato HTML:
http://elies.rediris.es/elies9
----------------------------------------------------
Estudios de Lingüística Española http://elies.rediris.es
------------------------------------------------------
More information about the Infoling
mailing list