Novedad bibliogr áfica: ALCÁNTA RA, M. Introducción al análisis de estructuras lingüísticas en corpus. Aproximación semántica
Carlos Subirats
carlos.subirats at GMAIL.COM
Sun Nov 25 00:19:52 UTC 2007
------------------- INFOLING --------------------
Lista de distribución sobre lingüística del español (ISSN: 1576-3404): http://elies.rediris.es/infoling/
Envío de información: infoling-request at listserv.rediris.es
EDITORES:
Carlos Subirats Rüggeberg, UAB <carlos.subirats at uab.es>
Mar Cruz Piñol, U. Barcelona <mcruz at ub.edu>
Eulalia de Bobes Soler, U. Abat Oliba-CEU <debobes1 at uao.es>
Equipo de edición: http://elies.rediris.es/infoling/editores.html
Estudios de Lingüística del Español (ELiEs): http://elies.rediris.es
es una red temática de lingüística del español asociada a INFOLING.
---------------------------------------------------------------------
INFOLING: una lista de distribución independiente y plural
© Infoling, Barcelona (España) 1998-2007. Reservados todos los derechos
--------------------------------------------------------------------------------
Novedad bibliográfica:
ALCÁNTARA PLÁ, Manuel. 2007. Introducción al análisis de estructuras
lingüísticas en corpus. Aproximación semántica. Madrid: Servicio de
Publicaciones de la Universidad Autónoma de Madrid (ISBN:
987-84-8344-069-8, No. de págs.: 189, Precio: 15 euros).
Web del editor: http://www.uam.es/servicios/otros/spublicaciones/
--------------------------------------------------------------------------------
Presentación
La búsqueda de una estructura relevante para el análisis de las
lenguas naturales ha sido la tarea principal de la lingüística desde
sus orígenes y uno de los mayores problemas en los últimos tiempos
dentro del ámbito de la inteligencia artificial y de la lingüística
computacional. El presente libro introduce al lector en la
estructuración formal de las lenguas oral y escrita a través del
trabajo empírico con colecciones de textos.
La obra se divide en dos partes, que pueden interesar a lectores --o
momentos de lectura-- diferentes. La primera (capítulos 1, 2, 3 y 4)
está dedicada a introducir, por un lado, el análisis eventivo y, por
otro, el trabajo lingüístico con corpus. Se revisan los trabajos
clásicos de la lingüística de corpus así como los principales
acercamientos al análisis semántico de textos. Como fruto de ambos
aspectos y ejemplo real de su utilidad, se presenta el sistema de
anotación SESCO y la experiencia del etiquetado de documentos orales y
escritos, con especial interés en los problemas prácticos.
Esta primera parte puede ser de utilidad para todo aquel interesado en
la anotación de corpus con información lingüística ya sea con el
conjunto de etiquetas propuesto aquí o con cualquier otro. Los
trabajos de etiquetado de corpus son realmente escasos (aún menores si
nos referimos a los de corpus de habla espontánea) y esto le da un
valor añadido a testimonios como el que aportamos. La exposición no
presupone un conocimiento especializado por parte del lector ya que
incluye la explicación detallada de todos los conceptos de semántica
relacional que se utilizan. Puede ser de especial provecho para
estudiantes o investigadores de lingüística computacional y de
procesamiento del lenguaje natural.
La segunda parte del libro (capítulos 5, 6, 7 y 8) es un estudio
básico de las estructuras sintácticas que conforman el español en tres
niveles: la palabra, el sintagma y el discurso. Puesto que nuestro
análisis semántico es oracional, la descripción tomará la oración como
punto de referencia para detallar los análisis de las otras unidades.
A pesar de su modesta extensión, se trata probablemente de la primera
gramática general del habla espontánea del español basado
completamente en corpus.
Esta segunda parte será relevante para el interesado en el análisis
semántico, en el funcionamiento de la lengua española hablada o en el
uso general de la información codificada en los corpus para su
posterior estudio lingüístico. Al estar basado en SESCO, presupone
cierta familiaridad con lo expuesto en el capítulo 4 de la primera
parte.
El libro incluye abundantes ejemplos tomados directamente de los
corpus para clarificar los resultados y los conceptos explicados en
ambas partes. El estilo y la estructuración del libro permiten su
lectura tanto por estudiantes universitarios interesados en una
introducción a la lingüística de corpus como por investigadores
interesados en el uso --cada vez más frecuente-- del análisis
semántico para la explotación de colecciones de textos.
ÍNDICE
1. Introducción
1.1. Estructuras
1.2. Semántica
1.3. Corpus
1.4. La lectura de este libro
2. El trabajo con corpus
2.1. Introducción
2.2. La lingüística de corpus
2.3. Tipos de corpus
2.4. Dos ejemplos
2.5. Breve aclaración sobre el uso de corpus
3. El análisis semántico oracional
3.1. Introducción
3.2. El significado
3.3. La semántica relacional
3.4. Eventos
3.5. Argumentos y relaciones indirectas
3.6. Relaciones abstractas
3.7. Los eventos en el discurso
4. El etiquetado con información semántica
4.1. Introducción
4.2. El conjunto de etiquetas
4.3. La labor de etiquetado
4.4. Etiquetado manual
4.5. Etiquetado semi-automático
4.6. Los estándares
5. Estructuras sintácticas
6. Palabras
6.1. Introducción
6.2. Las palabras del predicado
6.3. Las palabras de los argumentos
6.4. Morfosintaxis de las relaciones indirectas
6.5. Nueva definición de las clases de palabras
7. Sintagmas
7.1. La posición de los elementos en el evento
7.2. Sintaxis de los elementos del evento
7.3. Sintaxis y tipos eventivos
8. Notas para una estructuración del discurso
8.1. Introducción
8.2. Los tipos de referencias y sus distancias
8.3. Otras variables en juego
8.4. To be continued...
9. Conclusiones
10. Propuestas para el futuro
Más información sobre esta novedad bibliográfica:
http://www.mcu.es/cgi-brs/BasesHTML/isbn/BRSCGI?CMD=VERDOC&CONF=AEISPA.cnf&BASE=ISBN&DOCN=001425482&NDOC=1&EXPBUS=(DISPONIBLE).WDIS.+%26+(978-84-8344-069-8).WISB.
Web del autor:
Manuel Alcántara Plá, Austrian Research Institute for AI:
http://www.ofai.at/~manuel.alcantara/
----------------------------------------------------------------------
Wikipedia en latín:
Vicipaedia Latina: http://la.wikipedia.org/wiki/Pagina_prima
Número total de artículos: 15.000
----------------------------------------------------------------------
More information about the Infoling
mailing list