Informaci ón sobre tesis doctoral: QUIROZ, G. Á. Los sintagmas nominales extensos espe cializados en inglés y en español: descrip ción y clasificación en un corpus de genoma

Mon Jun 2 22:02:57 UTC 2008

-------------------          INFOLING          --------------------
Lista de distribución sobre lingüística del español (ISSN: 1576-3404):  http://elies.rediris.es/infoling/
Envío de información: infoling-request at listserv.rediris.es
EDITORES:
Carlos Subirats Rüggeberg, UAB <carlos.subirats at uab.es>
Mar Cruz Piñol, U. Barcelona <mcruz at ub.edu>
Eulalia de Bobes Soler, U. Abat Oliba-CEU <debobes1 at uao.es>
Equipo de edición: http://elies.rediris.es/infoling/editores.html
Estudios de Lingüística del Español (ELiEs): http://elies.rediris.es
es una red temática de lingüística del español asociada a INFOLING.

---------------------------------------------------------------------

Infoling (1996-2008): 3.200 participantes en más de 50 países

Con el apoyo de Editorial Arco Libros
Consulta su catálogo de Lingüística, E/LE, Historia y Publicaciones periódicas:
http://www.arcomuralla.com/Arco/Shop/default.asp

--------------------------------------------------------------------------------------------------------
Información sobre tesis doctoral:
QUIROZ HERRERA, Gabriel Ángel. Los sintagmas nominales extensos
especializados en inglés y en español: descripción y clasificación en
un corpus de genoma.
Institut Universitari de Lingüística Aplicada, Universidad Pompeu
Fabra (Barcelona, España)
--------------------------------------------------------------------------------------------------------

1. Autor:
Gabriel Ángel Quiroz Herrera

2. Título de la tesis:
Los sintagmas nominales extensos especializados en inglés y en
español: descripción y clasificación en un corpus de genoma
2.1 Número de páginas: 425 pp, anexos en CD-ROM
2.2 Palabras clave: sintagmas nominales, gramática comparada,
terminología, traducción, lenguajes de especialidad, inglés, español,
corpus, genoma

3. Fecha de lectura o defensa:
15 de mayo de 2008

4. Departamento, centro o laboratorio en el que se ha desarrollado:
Institut Universitari de Lingüística Aplicada
Universidad Pompeu Fabra
Barcelona, España

5. Directora:
Prof. Mercè Lorente Casafont

6. Proyecto o línea de investigación en el que se incluye:

- Ricoterm 2: Control terminológico y discursivo para larecuperación
de información en ámbitos comunicativos especializados, mediante
recursos lingüísticos específicos y un reelaborador de consultas.
Ministerio de Ciencia y Tecnología. HUM2004-056658-00. 2004-2007

- Texterm 2: Fundamentos, estrategias y herramientas para el
procesamiento y extracción automáticos de información especializada.
Ministerio de Ciencia y Tecnología. DGES. BFF2003-2111. 2003-2006

7. Resumen e índice

En esta tesis doctoral se describen y clasifican los sintagmas
nominales extensos especializados (SNEE) de más de tres tokens en
inglés y en español en textos especializados del nivel experto-experto
en el área del genoma.

El objeto de esta tesis es la descripción sintáctica y semántica de
sintagmas nominales extensos que aparecen con frecuencia en los
discursos de especialidad. Las preguntas formuladas en entorno a este
objeto de estudio van desde el carácter terminológico que puedan tener
estas unidades hasta la caracterización de estas piezas a partir de
los patrones categoriales y de las clases semánticas a las que
pertenecen los sintagmas y cada uno de los formantes que las integran.
Igualmente, se presenta una descripción cuantitativa de la frecuencia
de este tipo de unidades en los corpus textuales y también de la forma
de representación que reciben en diccionarios.

En objetivo de la tesis es validar empíricamente, a partir del
análisis cualitativo (reforzado también con un análisis cuantitativo
del corpus empleado), las hipótesis planteadas sobre la relevancia de
estas piezas en el discurso especializado, y su naturaleza en la
formación del léxico especializado, ya que que los datos demuestran
que no se originan en la interferencia lingüística, que no son fruto
de estilos idiolectales de los autores y que responden a necesidades
denominativas reales. Se analizan cuáles son los patrones más
frecuentes, tanto desde el punto de vista formal como desde el punto
de vista semántico. Además se correlacionan estructuras formales y
estructuras conceptuales, por mostrar tendencias que afectan la
variación denominativa en el discurso de genoma, en unos casos, y del
discurso de especialidad, en general. Los resultados además rebaten
algunas formulaciones de la gramática descriptiva referidas a la
limitación de los sintagmas en su extensión o la nula productividad de
algunos patrones.

Los fenómenos que se analizan pueden resumirse básicamente en:

a) el estudio morfosintático y cuantitativo de la premodificación
compleja de los sintagmas nominales en inglés;
b) el estudio morfosintático y cuantitativo de la posmodificación en español;
c) el análisis de la correlación entre las estructuras y las
categorías semánticas;
d) las tendencias semánticas de estos sintagmas en cuantos a clases y patrones;
e) el comportamiento de los sintagmas nominales extensos en
diccionarios especializados y corpus de referencia;
f) y, finalmente las tendencias de traducción de este tipo de
sintagmas en un corpus paralelo y en un diccionario de medicina.

Para esta tesis se ha constituido un corpus especializado en inglés y
un corpus especializado en español a partir del Corpus Técnic del
IULA, como corpus de análisis. Además, se ha compilado un corpus
paralelo inglés-español en medicina para extraer las regularidades en
traducción. Para contrastar los resultados, se ha compilado un corpus
lexicográfico compuesto por cinco diccionarios de varias áreas del
conocimiento; se ha consultado el corpus CREA de la RAE.

Los resultados de esta tesis se han guardado en una base de datos en
Access y con los datos corpus paralelo se ha creado una aplicación en
formato HTML para uso de traductores y terminólogos que trabajan del
inglés al español que pronto estará disponible en Internet.

Índice:

1. LOS SINTAGMAS NOMINALES EXTENSOS ESPECIALIZADOS EN INGLÉS Y EN
ESPAÑOL: DESCRIPCIÓN Y CLASIFICACIÓN EN UN CORPUS DE GENOMA
1.1 INTRODUCCIÓN
1.2 ANTECEDENTES DE LA TESIS
1.3 OBJETO DE ANÁLISIS
1.4 HIPÓTESIS Y SUPUESTOS DE PARTIDA
1.5 OBJETIVOS DE LA TESIS
1.6 ORGANIZACIÓN DE LA TESIS

2. LOS SNEE VISTOS DESDE DIFERENTES DISCIPLINAS DEL LENGUAJE
2.1 INTRODUCCIÓN
2.2 UN FENÓMENO, MUCHOS NOMBRES
2.3 GRAMÁTICA CLÁSICA
2.4 TERMINOLOGÍA
2.5 ESTUDIOS DE TRADUCCIÓN
2.6 TRADUCCIÓN AUTOMÁTICA
2.7 INGLÉS PARA PROPÓSITOS ESPECÍFICOS (ESP)
2.8 LINGÜÍSTICA COMPUTACIONAL E INGENIERÍA LINGÜÍSTICA
2.9 ESCRITURA TÉCNICA
2.10 COMPARACIÓN DE ALGUNOS ESTUDIOS

3. METODOLOGÍA GENERAL DE TRABAJO Y CONSTITUCIÓN DE CORPUS
3.1 INTRODUCCIÓN
3.1.1 Descripción y selección de los corpus de referencia
3.1.2 Descripción y selección del corpus en inglés
3.1.3 Descripción y selección del corpus en español
3.1.4 Descripción y selección del corpus paralelo inglés-español
3.1.5 Descripción y selección del corpus lexicográfico
3.2 HERRAMIENTAS Y RECURSOS
3.2.1 Herramientas de etiquetaje
3.2.1.1 Machinese Phrase Tagger online demo
3.2.2.2 WordNet 2.1
3.2.2.3 EuroWordNet 1.6 para el español
3.2.1.4 UMLS 2006 AB/AC
3.2.2 Diccionarios en CD-ROM
3.3 METODOLOGÍA DE ANÁLISIS GENERAL
3.4 PROBLEMAS DE ETIQUETAJE
3.5 EXTRACCIÓN DE LAS UNIDADES Y TRATAMIENTO DE LOS DATOS
3.6 ASPECTOS ESTADÍSTICOS
3.7 SELECCIÓN DE LAS MUESTRAS PARA LOS ANÁLISIS

4. ANÁLISIS FORMAL DE LOS PATRONES EN INGLÉS
4.1 INTRODUCCIÓN
4.2 CRITERIOS Y SELECCIÓN DEL CORPUS DE ANÁLISIS EN INGLÉS
4.3 RESULTADOS
4.3.1 Longitud y frecuencia de los SN en inglés
4.3.2 Categoría léxica predominante en la premodificación
4.3.3 Frecuencia de los patrones por aparición
4.3.4 Frecuencia de los patrones por longitud
4.3.5 Relaciones de dependencia del corpus de análisis en inglés
4.4 RESULTADOS DEL CORPUS LEXICOGRÁFICO DE CONTRASTE EN INGLÉS
4.4.1 Longitud y frecuencia de los SN en los diccionarios en inglés
4.4.2 Categoría léxica predominante en la premodificación de los SN en
los diccionarios en inglés
4.4.3 Frecuencia de los patrones por aparición en inglés
4.4.4 Frecuencia de los patrones por longitud en diccionarios en inglés
4.5 CONTRASTE DE RESULTADOS ENTRE EL CORPUS DE ANÁLISIS Y EL CORPUS
LEXICOGRÁFICO EN INGLÉS
4.5 1 Distribución de acuerdo con la longitud
4.5.2 Categoría léxica predominante y aspectos morfológicos
4.5.3 Frecuencia de los patrones por aparición
4.5.4 Frecuencia de los patrones por longitud
4.6 RECAPITULACIÓN

5. ANÁLISIS FORMAL DE LOS PATRONES EN ESPAÑOL
5.1 INTRODUCCIÓN
5.2 CRITERIOS Y SELECCIÓN DEL CORPUS DE ANÁLISIS EN ESPAÑOL
5.3 RESULTADOS
5.3.1 Longitud y frecuencia de los SN en español
5.3.2 Categoría léxica predominante en la posmodificación
5.3.3 Frecuencia de los patrones por aparición
5.3.4 Frecuencia de los patrones por longitud
5.3.5 Relaciones de dependencia del corpus de análisis en español
5.4 RESULTADOS DEL CORPUS LEXICOGRÁFICO DE CONTRASTE EN ESPAÑOL
5.4.1 Longitud y frecuencia de los SN en los diccionarios en español
5.4.2 Categoría léxica predominante en la modificación de los SN en
los diccionarios en español
5.4.3 Frecuencia de los patrones por aparición en español
5.4.4 Frecuencia de los patrones por longitud en los diccionarios en inglés
5.5 CONTRASTE DE RESULTADOS ENTRE EL CORPUS DE ANÁLISIS Y EL CORPUS
LEXICOGRÁFICO EN ESPAÑOL
5.5.1 Distribución de acuerdo con la longitud
5.5.2 Categoría léxica predominante y aspectos morfológicos
5.5.3 Frecuencia de los patrones por aparición
5.5.4 Frecuencia de los patrones por longitud
5.6 CONTRASTE DE LOS RESULTADOS CON LOS PATRONES ENCONTRADOS CON LOS
DEL CREA DE LA RAE
5.7 RECAPITULACIÓN

6. DESCRIPCIÓN Y ANÁLISIS SEMÁNTICO DE LOS PATRONES EN INGLÉS
6.1 INTRODUCCIÓN
6.2 CRITERIOS Y SELECCIÓN DEL CORPUS DE ANÁLISIS EN INGLÉS
6.3 METODOLOGÍA
6.4 RESULTADOS
6.4.1 Análisis de las clases semánticas de los núcleos según WordNet 2.1
6.4.2 Análisis de las clases semánticas de la premodificación según WordNet 2.1
6.4.2.1 Clases semánticas de acuerdo con la posición dentro de la
premodificación
6.4.2.2 Clases semánticas de acuerdo con la categoría léxica
6.4.3 Patrones semánticos obtenidos de WordNet 2.1
6.4.4 Patrones semánticos en la premodificación según WordNet 2.1
6.4.5 Análisis de las clases semánticas de los núcleos según UMLS
6.4.6 Análisis de las clases semánticas de la premodificación según UMLS
6.4.7 Patrones semánticos obtenidos de UMLS
6.4.8 Patrones semánticos en la premodificación según UMLS
6.5 RECAPITULACIÓN

7. DESCRIPCIÓN Y ANÁLISIS SEMÁNTICO DE LOS PATRONES EN ESPAÑOL
7.1 INTRODUCCIÓN
7.2 CRITERIOS Y SELECCIÓN DEL CORPUS DE ANÁLISIS EN ESPAÑOL
7.3 METODOLOGÍA
7.4 RESULTADOS
7.4.1 Análisis de las clases semánticas de los núcleos según EuroWordNet
7.4.2 Análisis de las clases semánticas de la modificación según EuroWordNet
7.4.2.1 Clases semánticas de acuerdo con la posición dentro de la modificación
7.4.2.2 Clases semánticas de acuerdo con la categoría léxica
7.4.3 Patrones semánticos obtenidos de EuroWordNet
7.4.4 Patrones semánticos en la modificación según EuroWordNet
7.5 RECAPITULACIÓN

8. DESCRIPCIÓN Y ANÁLISIS DE LOS SINTAGMAS NOMINALES EN EL CORPUS PARALELO
8.1. INTRODUCCIÓN
8.2. RECOLECCIÓN DEL CORPUS PARALELO Y EXTRACCIÓN DE LOS DATOS
8.3. RESULTADOS
8.3.1. Longitud y frecuencia de los sintagmas nominales
8.3.1.1. Distribución de longitud entre sintagmas nominales
8.3.1.2. Distribución según el número de tokens
8.3.2. Categoría léxica predominante en la premodificación del corpus paralelo
8.3.3. Frecuencia de patrones en inglés
8.3.4. Frecuencia de patrones por longitud
8.3.5. Selección de la muestra
8.3.6. Clasificación de soluciones de acuerdo con la dependencia sintáctica
8.3.7. Resultados del corpus paralelo de acuerdo con el patrón en inglés
8.4. CORRELACIÓN ENTRE EL CORPUS PARALELO Y EL DICCIONARIO MOSBY
8.5. CORRELACIÓN ENTRE EL CORPUS PARALELO Y LOS CORPUS TÈCNIC DEL IULA
Y CREA DE LA RAE
8.6 ANÁLISIS DE LOS PATRONES EN INGLÉS Y LOS EQUIVALENTES EN ESPAÑOL
8.6. RECAPITULACIÓN

9. CONCLUSIONES: RESULTADOS Y LÍNEAS DE TRABAJO FUTURO
9.1 SÍNTESIS DE LOS RESULTADOS
9.2 VALIDACIÓN O FALSACIÓN DE HIPÓTESIS
9.3 APORTES DE LA TESIS
9.3.1 Aportes sobre la descripción de los SNEE
9.3.1.1. Gramáticas de la lengua general
9.3.1.2. Manuales de terminología
9.3.1.3 Aporte a la TCT
9.3.2 La aplicabilidad de la descripción de los SNEE
9.3.2.1 La base de datos
9.3.2.2 Recomendaciones para la enseñanza de la traducción
9.3.2.3 Recomendaciones para la enseñanza de la terminología
9.3.2.4 Recomendaciones para la extracción de la terminología
9.4 LIMITACIONES DE LA TESIS Y LÍNEAS DE TRABAJO FUTURO

BIBLIOGRAFÍA
PROGRAMAS DE PROCESAMIENTO Y FUENTES DE CONSULTA

ANEXO 1: LISTADO DE PATRONES DE EXTRACCIÓN EN INGLÉS
ANEXO 2: LISTADO DE PATRONES DE EXTRACCIÓN EN ESPAÑOL
ANEXO 3: LISTADO DE PATRONES DE FINALES EN INGLÉS
ANEXO 4: LISTADO DE PATRONES DE FINALES EN ESPAÑOL

La tesis incluye una BD de datos en Access con todos los datos de la
tesis y un aplicación para traductores.

8. Correo-e del autor
gabriel.quiroz at gmail.com

9. Cómo obtener la tesis:

- Se puede obtener en formato PDF, solicitándolo directamente al autor.

La tesis se publicará en:
- Tesis Doctorales en Red (TDR): http://www.tdr.cesca.es/es/UPF.html
- Serie Tèsis del Institut Universitari de Lingüistica Aplicada (IULA)
de la Universidad Pompeu Fabra (Barcelona, España):
http://www.iula.upf.edu/edis1ca.htm#05

----------------------------------------------------------------------
Arco Libros: un editor que apoya a Infoling
Consulta su catálogo de Lingüística, E/LE, Historia y Publicaciones periódicas:
http://www.arcomuralla.com/Arco/Shop/default.asp
----------------------------------------------------------------------
Utiliza el buscador de Estudios de Lingüística del Español (ELiEs) en
http://elies.rediris.es para realizar búsquedas en los contenidos de la
web de ELiEs.
----------------------------------------------------------------------