Tesis doctoral: Leoni, J. A. Mod èle d’analyse lex ico-syntaxique des locutions espagnoles

INFOLING List infoling at GMAIL.COM
Sat May 16 19:16:25 UTC 2009


-------------------          INFOLING          --------------------

Lista de distribución sobre lingüí­stica del español (ISSN: 1576-3404):  http://elies.rediris.es/infoling/
Enví­o de información: <infoling-request at listserv.rediris.es>
EDITORES:
Carlos Subirats Rüggeberg, UAB <carlos.subirats at uab.es>
Mar Cruz Piñol, U. Barcelona <mcruz at ub.edu>
Eulalia de Bobes Soler, U. Abat Oliba-CEU <debobes1 at uao.es>
Equipo de edición: http://elies.rediris.es/infoling/editores.html
Estudios de Lingüí­stica del Español (ELiEs): http://elies.rediris.es
es una red temática de lingüística del español asociada a INFOLING.

© Infoling, Barcelona (España) 1996-2009. Reservados todos los derechos

---------------------------------------------------------------------

Infoling: información global sobre lingüística hispánica

Con el apoyo de Editorial Arco Libros
Consulta su catálogo de Lingüística, E/LE, Historia y Publicaciones periódicas:
http://www.arcomuralla.com/Arco/Shop/default.asp

---------------------------------------------------------------------------------------
Tesis doctoral:
Leoni de León, Jorge Antonio. 2008. Modèle d’analyse lexico-syntaxique
des locutions espagnoles. Université de Genève (Suiza)
URL: http://www.unige.ch/cyberdocuments/theses2008/LeonideLeonJA/these.pdf
---------------------------------------------------------------------------------------

1. Autor: Leoni de León, Jorge Antonio

2. Título de la tesis:
Modèle d’analyse lexico-syntaxique des locutions espagnoles
2.1 Número de páginas:
2.2 Palabras clave: locuciones, fraseología, PLN, sintaxis,
lexicografía, léxico, español

3. Fecha de lectura o defensa: 24 de mayo de 2008

4. Departamento, centro o laboratorio en el que se ha desarrollado:
Université de Genève, Facultad de Letras, Departamento de Lingüística

5. Director: Eric Wehrli

6. Proyecto o línea de investigación en el que se incluye:


7. Resumen e índice

En esta tesis nos interesamos en la representación informática de la
sintaxis de las
unidades léxicas pluriverbales del español. El término francés,
expressions à mots multiples
designa un conjunto de fenómenos léxicos caracterizados todos por
recurrir al empleo de
varias unidades léxicas con el fin de producir un mismo efecto
denotativo o estilístico, a
menudo en circunstancias en las que un solo elemento léxico específico
habría sido
suficiente. Todas las categorías gramaticales se ven afectadas por esta
fenomenología. Por
ejemplo, la secuencia “ojo de buey” es un grupo nominal que designa un
tipo de tragaluz,
mientras que “meter la pata” es un grupo verbal que se refiere a una manera
particularmente torpe de intervenir en una situación.

La sintaxis de este tipo de expresiones plantea varios problemas
vinculados con su
estatus en el léxico. A lo que se agrega una situación
terminológicamente ambigua: el
nivel del lenguaje designado por el término francés expressions à mots
multiples no está
siempre claro. Esta situación se manifiesta en el hecho de que esta
noción designa tanto
elementos del habla, como de la lengua. Con el fin de diferenciar mejor
los elementos
léxicos implicados en la frase, en el capítulo 2 distinguimos tres
conceptos : los vocablos,
unidades del habla que se realizan como secuencias de caracteres
limitadas por espacios
en blanco, los lexemas, unidades abstractas del léxico, y los
morfolexemas, unidades intermedias que corresponden a uno o varios
vocablos relacionados con un solo lexema.

La noción de lema queda limitada a las entradas de un diccionario.
Estas distinciones
tienen tres consecuencias directas: en primer lugar descartamos el
término expressions à
mots multiples, en su lugar adoptamos el término unidad fraseológica,
dado que nuestra
investigación es de naturaleza lexicográfica; luego, definimos las
unidades fraseológicas
en términos de vínculos entre lexemas; finalmente, estas distinciones
nos llevan a estable-
cer una tipología de las unidades léxicas plurimembres sobre nuevas
bases formales de
orientación sintáctica.

Siendo que el conocimiento adecuado del comportamiento del objeto por
representar
constituye una de las exigencias de todo modelo informático, en el
capítulo 3 identifi-
camos y describimos la fenomenología sintáctica de las unidades
fraseológicas. Luego
organizamos los resultados en una tipología consistente en tres
grandes clases: las
colocaciones (relaciones de alternancia léxica), las fusiones
temáticas (sintagmas compuestos de un verbo soporte y de un sustantivo
predicativo) y las unidades léxicas plurimembres (las unidades
fraseológicas propiamente dichas). Estas últimas incluyen, por un
lado, los lexemas plurimembres, que contienen las expresiones
nominales, adverbiales y adjetivas, y, por otra parte, los frasemas
que son expresiones verbales. En esta taxonomía también incluimos
otras subclases, definidas de igual manera según criterios
léxico-sintácticos. A partir de ese momento, nuestra investigación se
focalizó en las unidades léxicas plurimembres, las que abordamos según
el eje frástico implicado (paradigmático o
sintagmático). Los fenómenos paradigmáticos corresponden a
posibilidades de sustitución en la estructura de la unidad
fraseológica, mientras que los fenómenos sintagmáticos implican
relaciones de distancia, de las que resulta muchas veces una
discontinuidad de la
expresión. Por ejemplo, en el eje sintagmático, “meter la pata” es una
expresión verbal cuyo
argumento interno mutatis mutandi puede ser reemplazado por un
pronombre clítico: “él
la metió hasta el fondo”. En lo concerniente a sus posibilidades en el
eje paradigmático, el
argumento interno de esa misma expresión puede ser sustituido por una
perífrasis: “meter
las de andar”.

En el capítulo 4, definimos un sistema de notación formal, llamado
Tsool, capaz de
restituir las características léxico-sintácticas de una unidad
fraseológica. Tsool es un
formalismo versátil que permite, entre otros, tanto establecer
relaciones interlingüísticas para
la traducción, como especificar definiciones y ejemplos, respetando siempre las
estructuras de argumentos. Además, Tsool ha sido concebido para
representar la explotación de datos morfosintácticos de una cantidad
arbitraria de sistemas automatizados de datos lingüísticos. En nuestro
caso, nosotros recurrimos a los analizadores léxico y sintáctico de FI
P S del Laboratoire d’Analyse et de Technologie du Langage (L AT L) de
la Universidad de Ginebra, sobre el cual basamos nuestros análisis de
la frase. En el capítulo 5, nuestro modelo, llamado MuLKiN, reproduce
la formalización Tsool por medio de tecnologías del universo XML
procesadas por medio de un conjunto de programas escritos en Perl.
Nuestros ejemplos del sistema están basados en una prueba de concepto
que ilustra las principales características del modelo, así como
nuestras estrategias básicas de
procesamiento.

En resumen, en esta investigación buscamos crear un modelo informático
fraseológico
del español basado en la fenomenología léxico-sintáctica de las
expresiones idiomáticas.
A partir de una tipología que toma en cuenta el comportamiento de las unidades
fraseológicas al nivel de la oración, en este trabajo establecemos una
formalización relacional de las unidades léxicas complejas que permite
automatizar el cálculo de idiomaticidad.


8. Correo-e del autor: <apartado.de.antonio at gmail.com>

9. Cómo obtener la tesis
http://www.unige.ch/cyberdocuments/theses2008/LeonideLeonJA/these.pdf

----------------------------------------------------------------------
Arco Libros: un editor que apoya a Infoling
Consulta su catálogo de Lingüística, E/LE, Historia y Publicaciones periódicas:
http://www.arcomuralla.com/Arco/Shop/default.asp
----------------------------------------------------------------------
Breve historia informal de Infoling desde 1996 hasta 2006:
Una crónica personal de los avatares de la lista durante la última década:
http://listserv.rediris.es/cgi-bin/wa?A2=ind0605&L=infoling&P=R3229
----------------------------------------------------------------------



More information about the Infoling mailing list