Curso "El Trabajo con corpus textuales: aplicación de las herramientas =?iso-8859-1?Q?lexicom=E9tricas?=" - PRIMER SEMESTRE 2002-2003 - Barcelona (=?iso-8859-1?Q?Espa=F1a?=)

INFOLING mcruz at FIL.UB.ES
Wed Sep 25 10:29:47 UTC 2002


INFOLING. Lista moderada de lingüística española (ISSN: 1576-3404):
              http://elies.rediris.es/infoling/
                 Repetidor (mirror) en EE.UU:
     http://listserv.linguistlist.org/archives/infoling.html
   Envío de información: infoling-request at listserv.rediris.es
                           EDITORES:
      Carlos Subirats Rüggeberg <subirats at icsi.berkeley.edu>
          Mar Cruz Piñol, U. Barcelona <mcruz at fil.ub.es>
       Eulalia de Bobes Soler, UAB <Eulalia.deBobes at uab.es>
                      EQUIPO DE EDICIÓN:
        http://elies.rediris.es/infoling/editores.html
   La lista de distribución Infoling está asociada a la red temática
     ESTUDIOS DE LINGÜÍSTICA ESPAÑOLA http://elies.rediris.es
____________________________________________________________________

UNIDAD TÉCNICA DE LEXICOMETRÍA
OFERTA DE ACTIVIDADES
PRIMER SEMESTRE 2002-2003
Barcelona (España)
____________________________________________________________________

Nombre completo del curso:
El Trabajo con corpus textuales: aplicación de las herramientas
lexicométricas
Duración: 30 horas
Fechas: A partir del 18 de octubre de 2002; viernes de octubre a
diciembre, en horario de mañana
Tipo de certificado: Certificado de asistencia y aprovechamiento

Programa:
1. Definición de lexicometría o estadística textual
1.1 Breve introducción histórica a los estudios lexicométricos
1.2 Características de los métodos lexicométricos
1.2.a Descripción cuantitativa de los textos
1.2.b Reorganización formal de la secuencia textual
1.3 Resultados obtenidos
1.3.a Observación del comportamiento léxico global de un cor-pus
tex-tual y de sus partes
1.3.b Inventarios léxicos
1.3.c Cálculos estadísticos
1.4 Aplicaciones
1.4.a Aplicación al ámbito general de las ciencias humanas y sociales
1.4.b Aportaciones al comentario de textos literarios
1.4.c Aplicacions al ámbito del estudio del estilo (estilometría)
1.4.d Aplicación específica en el campo del discurso socio-político

2. Conceptos y terminología lexicométrica
2.1 Caracteres delimitadores y no delimitadores
2.2 Delimitadores de ocurrencia, de secuencia y de frase
2.3 Ocurrencia, forma y lema
2.4 Segmentos repetidos y coocurrencias
2.5 Marcaje o etiquetaje

3. Proceso de trabajo lexicométrico
3.1 Diseño del corpus textual: reflexión en torno a la finalidad de la
investigación y los objetivos a alcanzar con el análisis del corpus
3.2 El texto en soporte magnético
3.2.a Uso del escáner con programas de reconocimiento de carac-teres (OCR)
3.2.b Archivos de textos digitales (CD-ROM)
3.2.c Recuperación de textos electrónicos
3.3 Marcaje de los textos
3.3.a Necesidad del marcaje textual: ventajas y desventajas de los
diversos niveles de etiquetaje del texto
3.3.b Criterios de registro informático de textos
3.3.c Convenciones de codificación: claves de referenciación y de
información paratextual
3.3.d Principales sistemas de marcaje utilizados con los programas lexicométricos
3.4 Aplicación de los programas de análisis lexicométrico
3.5 Obtención y recuperación de resultados

4. Métodos lexicométricos
4.1 Métodos documentales
4.1.a Índices alfabéticos y frecuenciales
4.1.b Concordancias lematizadas y no lematizadas
4.1.c Segmentos repetidos
4.2 Métodos estadísticos multidimensionales
4.2.a Análisis de las especificidades
4.2.b Análisis factorial de correspondencias
4.2.c Índices de riqueza léxica

5. Presentación del software lexicométrico para ordenadores personales
uti-lizado en la Unitat Tècnica de Lexicometria
5.1 El módulo de programas desarrollados por el Laboratoire de
Lexicométrie et Textes Politiques de Fontenay-St Cloud i l’Institut
National de la Langue Française (INaLF)
5.2 Textual Analysis Computing Tools (TACT), desarrollado por el
Centre for Computing in Humanities de la Universidad de Toronto
5.3 Archivo Digital de Manuscritos y Textos Españoles (ADMYTE):
explo-tación de los datos textuales contenidos en el archivo digital
del CD-ROM
5.4 Concorder, desarrollado por el Centre de Recherches Mathématiques
de la Universidad de Montréal
5.5 Hyperbase, programa hipertextual desarrollado por la Université de
Nice-Sophia Antipolis y el Institut National de la Langue Française (INaLF)

6. Recursos específicos aplicados a las llamadas "lenguas de corpus"
6.1 Archivos de textos digitalizados
6.2 Motores de búsqueda

7. Recursos sobre análisis lexicométrico en Internet
7.1 Página Web de la Unitat Tècnica de Lexicometria
7.2 Vínculos con los principales centros extranjeros
7.3 Publicaciones en formato electrónico
7.4 Acceso a textos electrónicos

8. Bibliografía especializada


INFORMACIÓN
Unitat Tècnica de Lexicometria (Universidad de Barcelona)
Gran Via de les Corts Catalanes, 583 - Aulario Josep Carner, 5º piso
08007 Barcelona
Tel. 93 403 56 94
Fax 93 403 55 96
Correo electrónico <nofre at lingua.fil.ub.es>

----------------------------------------------------
Web de INFOLING: http://elies.rediris.es/infoling/
----------------------------------------------------



More information about the Infoling mailing list