Resumen de tesis doctoral: Carreras, F. 2002. Sistema Computacional de Gestión Morfológica del Español. Universidad de Las Palmas de Gran Canaria (España)
Carlos Subirats Rüggeberg
subirats at ICSI.BERKELEY.EDU
Mon Apr 7 07:29:21 UTC 2003
INFOLING
Lista de distribución de lingüística del español (ISSN: 1576-3404)
http://elies.rediris.es/infoling/
Envío de información: infoling-request at listserv.rediris.es
EDITORES:
Carlos Subirats Rüggeberg, UAB <subirats at icsi.berkeley.edu>
Mar Cruz Piñol, U. Barcelona <mcruz at fil.ub.es>
Eulalia de Bobes Soler, UAB <Eulalia.deBobes at uab.es>
Equipo de edición: http://elies.rediris.es/infoling/editores.html
"Estudios de Lingüística del Español": http://elies.rediris.es
es una red temática de lingüística del español asociada a Infoling.
-------------------------------------------------------------------------
Resumen de tesis doctoral:
Carreras Riudavets, Francisco. 2002. Sistema Computacional de
Gestión Morfológica del Español (SCOGEME). Universidad de Las Palmas de
Gran Canaria (Islas Canarias, España)
-------------------------------------------------------------------------
1. Autor:
Carreras Riudavets, Francisco
2. Título de la tesis:
Sistema Computacional de Gestión Morfológica del Español (SCOGEME)
2.1 Número de páginas:
2.2 Palabras clave:
3. Fecha de lectura o defensa:
27 de mayo de 2002
4. Departamento, centro o laboratorio en el que se ha desarrollado:
Grupo de Estructuras de Datos y Lingüística Computacional
Departamento de Informática y Sistemas
Universidad de Las Palmas de Gran Canaria
Islas Canarias, España
5. Directores:
Octavio Santana Suárez y José R. Pérez Aguiar
6. Proyecto o línea de investigación en el que se incluye:
Procesamiento del lenguaje natural y lingüística computacional,
morfología computacional y análisis de textos
7. Resumen e índice
En esta tesis se desarrolla un sistema capaz responder a cualquier
aspecto morfológico de una palabra del español, que abarca todo lo
relacionado con la morfología flexiva, derivativa y la prefijación,
para el establecimiento de relaciones morfosemánticas.
Permite el reconocimiento, la generación y la manipulación de las
relaciones morfosemánticas a partir de cualquier vocablo, así como el
del campo morfosemántico al que pertenece, categoría gramatical de la
base y de sus palabras relacionadas, incluye la recuperación de toda su
información lexicogenética hasta llegar a una primitiva, la gestión y
control de los afijos en el tratamiento de sus relaciones, así como la
regularidad en la relación establecida y otros aspectos.
Se organiza, sobre un corpus suficientemente amplio 134.109 formas
canónicas o entradas, un estudio taxonómico, exhaustivo y sistemático de
los afijos utilizados en las relaciones morfosemánticas que proporciona
una visión global del comportamiento y productividad de las palabras del
español en los principales procesos de formación —sufijación,
prefijación, parasíntesis, supresión, regresión, modificación-cero,
apócope, metátesis y otros no clasificables que generan grafías
alternativas— y se establece una descripción pormenorizada de las
relaciones entre palabra y afijo en el marco de la funcionalidad,
formalidad y semántica.
Se recopilan 90.000 relaciones morfosemánticas que dan lugar a unas
30.000 familias de palabras que conforman 14.000 clases distintas.
Los resultados obtenidos, junto con la herramienta FLAPE —Flexionador y
Lematizador Automático de Palabras de Español—, se integran para dar
lugar a un Sistema Computacional de Gestión Morfológica del Español
(SCOGEME) capaz de gestionar simultáneamente la morfología flexiva y la
derivativa, los prefijos y la parasíntesis, y las relaciones entre
palabras del español con un punto de encuentro en su historia etimológica.
Se obtiene una aplicación diseñada para ser de utilidad a quienes
tratan con documentos en español: lexicólogos, analistas de estilo,
recuperadores de información textual, traductores, etc. Una intuitiva
interfaz gráfica, con manejo de ventanas de diálogo, botones y demás
herramientas, facilita la interacción hombre-máquina. Esto supone un
primer paso hacia las múltiples posibilidades informáticas y
aplicaciones especializadas que deben desarrollarse sobre esta base de
conocimiento.
ÍNDICE
INTRODUCCIÓN
1.- LEXICÓN
2.- RELACIONES MORFOSEMÁNTICAS DEL ESPAÑOL
2.1 ALTERACIONES SUFIJALES
2.2 ALTERACIONES PREFIJALES
2.3 ALTERACIONES SUFIJALES Y PREFIJALES
2.4 OTRAS ALTERACIONES
3.- REGLAS GENERALES DE RELACIÓN
3.1 RELACIÓN SUFIJAL
3.1.1 Reglas de corte
3.1.2 Reglas de unión
3.2 RELACIÓN PREFIJAL
3.2.1 Reglas generales de unión de prefijos
3.2.2 Reglas particulares de algunos prefijos
4.- RELACIONES SUFIJALES
4.1 SUFIJO -A
4.2 SUFIJO -ÁCEO, ÁCEA.
4.3 SUFIJO -ACHO, ACHA.
4.4 SUFIJO -ACO, ACA.
4.5 SUFIJO -'ADA: ( 'ADA, 'ADE).
4.6 SUFIJO -'AGO, 'AGA.
4.7 SUFIJO -AINO, AINA.
4.8 SUFIJO -AJE.
4.9 SUFIJO -AJO, AJA.
4.10 SUFIJO AL.
4.11 SUFIJO ALES.
4.12 SUFIJO ALLO, ALLA, ALLE.
4.13 SUFIJO AMEN.
4.14 SUFIJO ÁN, ANA.
4.15 SUFIJO ÁNEO, ÁNEA.
4.16 SUFIJO ANO, ANA: ( ANO, IANO).
4.17 SUFIJO AÑO, AÑA.
4.18 SUFIJO ANZA: (-ANZA, -ENZA).
4.19 SUFIJO VERBALIZADOR AR.
4.20 SUFIJO NO VERBAL AR.
4.21 SUFIJO ARIO, ARIA.
4.22 SUFIJO ASTRO, ASTRA, ASTRE.
4.23 SUFIJO ATARIO, ATARIA.
4.24 SUFIJO ATE.
4.25 SUFIJO ÁTIL.
4.26 SUFIJO ATO, ATA.
4.27 SUFIJO AVO, AVA.
4.28 SUFIJO AZ.
4.29 SUFIJO AZGO, AZGA: ( AZGO, -ADGO).
4.30 SUFIJO AZO, AZA.
4.31 SUFIJO AZÓN.
4.32 SUFIJO BILIDAD.
4.33 SUFIJO BLE: ( ABLE, IBLE).
4.34 SUFIJO BUNDO: ( ABUNDO, EBUNDO, IBUNDO).
4.35 SUFIJO CIÓN: ( ACIÓN, ICIÓN).
4.36 SUFIJO 'CULO, 'CULA: ( 'CULO, ÁCULO, ÍCULO).
4.37 SUFIJO DAD: ( DAD, EDAD, IDAD).
4.38 SUFIJO DERO, DERA: ( ADERO, EDERO, IDERO).
4.39 SUFIJO DIZO, DIZA: ( ADIZO, EDIZO, IDIZO).
4.40 SUFIJO DO, DA: ( ADO, IDO).
4.41 SUFIJO -DOR, DORA: ( ADOR, EDOR, IDOR).
4.42 SUFIJO DUMBRE: ( EDUMBRE, IDUMBRE).
4.43 SUFIJO DURA: ( ADURA, EDURA, IDURA).
4.44 SUFIJO DURÍA: ( ADURÍA, EDURÍA, IDURÍA).
4.45 SUFIJO E.
4.46 SUFIJO EAR.
4.47 SUFIJO ECER.
4.48 SUFIJO ECO, ECA.
4.49 SUFIJO EDO, EDA.
4.50 SUFIJO EGO, EGA: ( EGO, IEGO).
4.51 SUFIJO EJO, EJA.
4.52 SUFIJO EL.
4.53 SUFIJO ELO, ELA.
4.54 SUFIJO ÉN.
4.55 SUFIJO ENCO, ENCA: ( ENCO, ENGO).
4.56 SUFIJO ENO, ENA.
4.57 SUFIJO EÑO, EÑA.
4.58 SUFIJO ENSE: ( ENSE, IENSE).
4.59 SUFIJO ENTA. 9
4.60 SUFIJO ENTO, ENTA: ( ENTO, IENTO, ULENTO, OLENTO).
4.61 SUFIJO EO, EA.
4.62 SUFIJO 'EO, 'EA.
4.63 SUFIJO ER: ( ER, IER).
4.64 SUFIJO ERÍA.
4.65 SUFIJO ERIO.
4.66 SUFIJO ERÍO.
4.67 SUFIJO ERIZO, ERIZA.
4.68 SUFIJO ERNO, ERNA.
4.69 SUFIJO ERO, ERA.
4.70 SUFIJO ÉS, ESA.
4.71 SUFIJO ESA.
4.72 SUFIJO ÉSIMO, ÉSIMA.
4.73 SUFIJO ETE, ETO, ETA.
4.74 SUFIJO EUTA.
4.75 SUFIJO EZ, EZA.
4.76 SUFIJO EZNO, EZNA.
4.77 SUFIJO GRAMA.
4.78 SUFIJO Í.
4.79 SUFIJO ÍACO, ÍACA: ( ÍACO, IACO).
4.80 SUFIJO ICIO, ICIA, ICIE.
4.81 SUFIJO ICO, ICA.
4.82 SUFIJO 'ICO, 'ICA.
4.83 SUFIJO 'IDE.
4.84 SUFIJO 'IDO, 'IDA.
4.85 SUFIJO IFICAR.
4.86 SUFIJO 'IGO, 'IGA.
4.87 SUFIJO IGUAR.
4.88 SUFIJO IJO, IJA.
4.89 SUFIJO 'IL.
4.90 SUFIJO IL.
4.91 SUFIJO ILLO, ILLA.
4.92 SUFIJO IMONIO, IMONIA.
4.93 SUFIJO ÍN, INA.
4.94 SUFIJO INA.
4.95 SUFIJO ÍNEO, ÍNEA.
4.96 SUFIJO INGO, INGA.
4.97 SUFIJO INO, INA.
4.98 SUFIJO IÑO, IÑA.
4.99 SUFIJO 'IO, 'IA.
4.100 SUFIJO ÍO, ÍA.
4.101 SUFIJO IÓN.
4.102 SUFIJO IR.
4.103 SUFIJO IS.
4.104 SUFIJO ISMO.
4.105 SUFIJO ISTA.
4.106 SUFIJO ÍSTICO, ÍSTICA.
4.107 SUFIJO ITA.
4.108 SUFIJO ITA.
4.109 SUFIJO ITO, ITA.
4.110 SUFIJO 'ITO, 'ITA.
4.111 SUFIJO ITUD.
4.112 SUFIJO IVO, IVA: ( IVO, ATIVO, ITIVO).
4.113 SUFIJO IZAR.
4.114 SUFIJO IZO, IZA.
4.115 SUFIJO MA: ( MA, EMA).
4.116 SUFIJO MBRE: ( AMBRE, IMBRE, UMBRE).
4.117 SUFIJO MENTE.
4.118 SUFIJO MENTO: ( AMENTO, IMENTO, AMIENTO, IMIENTO).
4.119 SUFIJO NCIA: ( ANCIA, ENCIA).
4.120 SUFIJO NDERO, NDERA: ( ANDERO, ENDERO).
4.121 SUFIJO NDO, NDA: ( ANDO, ENDO, IENDO, ONDO, IONDO).
4.122 SUFIJO NTE: ( ANTE, ENTE, IENTE).
4.123 SUFIJO O.
4.124 SUFIJO OL.
4.125 SUFIJO OLO, OLA, OL.
4.126 SUFIJO ÓN, ONA.
4.127 SUFIJO ONGO, ONGA.
4.128 SUFIJO OR, ORA.
4.129 SUFIJO 'ORA.
4.130 SUFIJO ORIO, ORIA.
4.131 SUFIJO OSO, OSA.
4.132 SUFIJO OTE, OTA, OTO.
4.133 SUFIJO RRO, RRA: ( ARRO, ORRO, ARRIO, ORRIO).
4.134 SUFIJO S.
4.135 SUFIJO SCO, SCA: ( ASCO, ESCO, ISCO, USCO).
4.136 SUFIJO TANO, TANA: ( TANO, ITANO, ETANO).
4.137 SUFIJO TICIO, TICIA: ( ATICIO, ITICIO).
4.138 SUFIJO 'TICO, 'TICA: ( TICO, ÁTICO, ÉTICO, ÍTICO, ÓTICO).
4.139 SUFIJO TORIO, TORIA: ( ATORIO, ITORIO).
4.140 SUFIJO TRIZ.
4.141 SUFIJO UCHO, UCHA.
4.142 SUFIJO UCO, UCA.
4.143 SUFIJO UDO, UDA.
4.144 SUFIJO UELO, UELA.
4.145 SUFIJO UJO, UJA.
4.146 SUFIJO 'ULO, 'ULA.
4.147 SUFIJO UNO, UNA.
4.148 SUFIJO URA.
4.149 SUFIJO URO.
4.150 SUFIJO UTO, UTA.
4.151 SUFIJO CERO.
4.152 FORMAS VERBALES.
4.153 OTRAS TERMINACIONES.
5.- RELACIONES PREFIJALES
5.1 PREFIJO A : (A , AN ).
5.2 PREFIJO AB : (AB , ABS ).
5.3 PREFIJO ABISO .
5.4 PREFIJO ACRO .
5.5 PREFIJO AD .
5.6 PREFIJO AL .
5.7 PREFIJO AMBI .
5.8 PREFIJO ANA .
5.9 PREFIJO ANFI .
5.10 PREFIJO ANTE .
5.11 PREFIJO ANTI .
5.12 PREFIJO APO .
5.13 PREFIJO ARCHI : (ARCHI , ARQUI , ARQUE ).
5.14 PREFIJO AUTO .
5.15 PREFIJO BAR : (BAR , BARI , BARO ).
5.16 PREFIJO BATI .
5.17 PREFIJO BI : (BI , BIS , BIZ ).
5.18 PREFIJO CACHI .
5.19 PREFIJO CATA .
5.20 PREFIJO CIRCUN
5.21 PREFIJO CIS .
5.22 PREFIJO CITRA .
5.23 PREFIJO CON : (CON , CO ).
5.24 PREFIJO CONTRA .
5.25 PREFIJO CUASI .
5.26 PREFIJO DE .
5.27 PREFIJO DES .
5.28 PREFIJO DI .
5.29 PREFIJO DIA .
5.30 PREFIJO DIALI .
5.31 PREFIJO DIS .
5.32 PREFIJO E .
5.33 PREFIJO ECTO .
5.34 PREFIJO EN .
5.35 PREFIJO ENDO .
5.36 PREFIJO ENTRE .
5.37 PREFIJO EPI .
5.38 PREFIJO EQUI .
5.39 PREFIJO ES .
5.40 PREFIJO EU .
5.41 PREFIJO EX .
5.42 PREFIJO EXO .
5.43 PREFIJO EXTRA .
5.44 PREFIJO HEMI .
5.45 PREFIJO HETERO .
5.46 PREFIJO HIPER .
5.47 PREFIJO HIPO .
5.48 PREFIJO IN .
5.49 PREFIJO INFRA
5.50 PREFIJO INTER .
5.51 PREFIJO INTRA .
5.52 PREFIJO ISO .
5.53 PREFIJO MACRO .
5.54 PREFIJO MAXI .
5.55 PREFIJO MEGA .
5.56 PREFIJO MESO .
5.57 PREFIJO META .
5.58 PREFIJO MICRO .
5.59 PREFIJO MINI .
5.60 PREFIJO MONO .
5.61 PREFIJO MULTI .
5.62 PREFIJO OB : (OB , OP ).
5.63 PREFIJO OMNI .
5.64 PREFIJO OPISTO .
5.65 PREFIJO PAN .
5.66 PREFIJO PARA .
5.67 PREFIJO PEN .
5.68 PREFIJO PER .
5.69 PREFIJO PERI .
5.70 PREFIJO PLURI .
5.71 PREFIJO PLUS .
5.72 PREFIJO POLI .
5.73 PREFIJO POR .
5.74 PREFIJO POST : (POS , POST ).
5.75 PREFIJO PRE .
5.76 PREFIJO PRETER .
5.77 PREFIJO PRO .
5.78 PREFIJO PROTO .
5.79 PREFIJO RE .
5.80 PREFIJO REQUETE .
5.81 PREFIJO RES .
5.82 PREFIJO RETRO .
5.83 PREFIJO SEMI .
5.84 PREFIJO SIN .
5.85 PREFIJO SO : (SO , SON , SOS , SOZ ).
5.86 PREFIJO SOBRE .
5.87 PREFIJO SOTA : (SOTA , SOTO ).
5.88 PREFIJO SUB : (SU , SUB , SUS ).
5.89 PREFIJO SUPER .
5.90 PREFIJO SUPRA .
5.91 PREFIJO TATARA .
5.92 PREFIJO TELE .
5.93 PREFIJO TRANS : (TRANS , TRAS ).
5.94 PREFIJO ULTRA .
5.95 PREFIJO UNI .
5.96 PREFIJO VICE .
5.97 PREFIJO YUXTA .
5.98 PREFIJO ZA .
6.- RELACIONES PARASINTÉTICAS
6.1 RELACIONES CON EL SUFIJO A.
6.2 RELACIONES CON EL SUFIJO AL.
6.3 RELACIONES CON EL SUFIJO ÁNEO.
6.4 RELACIONES CON EL SUFIJO ANO.
6.5 RELACIONES CON EL SUFIJO ADJETIVADOR AR.
6.6 RELACIONES CON EL SUFIJO VERBALIZADOR AR.
6.7 RELACIONES CON EL SUFIJO ATE.
6.8 RELACIONES CON EL SUFIJO BLE.
6.9 RELACIONES CON EL SUFIJO CIÓN.
6.10 RELACIONES CON EL SUFIJO DERO.
6.11 RELACIONES CON EL SUFIJO DO.
6.12 RELACIONES CON EL SUFIJO DOR.
6.13 RELACIONES CON EL SUFIJO DURA.
6.14 RELACIONES CON EL SUFIJO E.
6.15 RELACIONES CON EL SUFIJO EAR.
6.16 RELACIONES CON EL SUFIJO ECER.
6.17 RELACIONES CON EL SUFIJO ERO.
6.18 RELACIONES CON EL SUFIJO 'ICO.
6.19 RELACIONES CON EL SUFIJO 'IDO.
6.20 RELACIONES CON EL SUFIJO IGUAR.
6.21 RELACIONES CON EL SUFIJO INO.
6.22 RELACIONES CON EL SUFIJO 'IO.
6.23 RELACIONES CON EL SUFIJO ÍA.
6.24 RELACIONES CON EL SUFIJO IR.
6.25 RELACIONES CON EL SUFIJO ISMO.
6.26 RELACIONES CON EL SUFIJO 'ITO.
6.27 RELACIONES CON EL SUFIJO IVO.
6.28 RELACIONES CON EL SUFIJO IZAR.
6.29 RELACIONES CON EL SUFIJO MENTE.
6.30 RELACIONES CON EL SUFIJO MIENTO.
6.31 RELACIONES CON EL SUFIJO NCIA.
6.32 RELACIONES CON EL SUFIJO –NTE.
6.33 RELACIONES CON EL SUFIJO O.
6.34 RELACIONES CON EL SUFIJO ÓN.
6.35 RELACIONES SINGULARES.
7.- OTRAS RELACIONES
7.1 AFÉRESIS.
7.2 APÓCOPE.
7.3 METÁTESIS.
7.4 REGRESIÓN O TRUNCAMIENTO.
7.5 SUPRESIÓN.
7.6 MODIFICACIÓN-CERO (TRANSCATEGORIZACIÓN).
7.7 FORMA-VERBAL.
7.8 ALTERNATIVA.
7.9 CASI ALTERNATIVA.
8.- FAMILIAS
8.1 ESTRUCTURA LÓGICA.
8.2 ESTRUCTURA FÍSICA.
8.3 NAVEGACIÓN.
8.3.1 Derivación.
8.3.1.1 Derivación sustantiva.
8.3.1.2 Derivación adjetiva.
8.3.1.3 Derivación verbal.
8.3.1.4 Derivación adverbial.
8.3.2 Dirección.
8.3.2.1 Ascendencia directa.
8.3.2.2 Ascendencia indirecta.
8.3.2.3 Horizontalidad.
8.3.2.4 Descendencia.
8.4 FILTROS.
8.4.1 Funcional
8.4.2 Morfológico.
8.4.3 Regularidad.
8.4.4 Afijo.
8.5 RESUMEN ESTADÍSTICO
9.- APLICACIÓN
10.- CONCLUSIONES
BIBLIOGRAFÍA
8. Correo-e del autor
Francisco Javier Carreras Riudavets <paco at eet.ulpgc.es>
9. Cómo obtener la tesis
De próxima publicación en la red.
Más información: http://www.gedlc.ulpgc.es/
----------------------------------------------------------------------
Utiliza el buscador de Estudios de Lingüística del Español (ELiEs) en
http://elies.rediris.es para realizar búsquedas en los contenidos de la
web de ELiEs.
----------------------------------------------------------------------
More information about the Infoling
mailing list