Resumen de tesis doctoral:=?iso-8859-1?Q?Mac=EDas?=, Javier. Arquitecturas y métodos en sistemas de reconocimiento automático de habla de gran vocabulario. Escuela Técnica Superior de Ingenieros de =?iso-8859-1?Q?Telecomunicaci=F3n?=, Universidad Politécnica de Madrid (=?iso-8859-1?Q?Espa=F1a?=)
Carlos Subirats Rüggeberg
carlos.subirats at UAB.ES
Fri Dec 14 16:49:42 UTC 2001
INFOLING. Lista moderada de lingüística española (ISSN: 1576-3404)
España: http://listserv.rediris.es/archives/infoling.html
http://www.rediris.es/list/info/infoling.html
EE.UU: http://listserv.linguistlist.org/archives/infoling.html
ESTUDIOS DE LINGÜÍSTICA ESPAÑOLA http://elies.rediris.es
Envío de información: mailto:infoling-request at listserv.rediris.es
COMITÉ DE REDACCIÓN:
http://elies.rediris.es/comite_de_redaccion.html
EDITORES:
Carlos Subirats Rüggeberg <Carlos.Subirats at uab.es>
Mar Cruz Piñol, U. Barcelona <mcruz at fil.ub.es>
Eulalia de Bobes Soler, UAB <Eulalia.deBobes at uab.es>
INFORMACIÓN SOBRE AMÉRICA LATINA:
Alexandra Álvarez, U. de Los Andes <xandra at icnet.com.ve>
EQUIPO DE REDACCIÓN:
Lídia Moya, UAB <Lidia.Moya at uab.es>
Blanca Pascual, UAB <Blanca.Pascual at uab.es>
Judit Torres, UAB <mjtorresh at seneca.uab.es>
____________________________________________________________________
Con el patrocinio de ARCO/LIBROS,
editorial especializada en lingüística española:
http://www.arcomuralla.com/arco/Colecciones.htm#Filologia
http://www.arcomuralla.com/arco/Colecciones.htm#Publicaciones
____________________________________________________________________
Resumen de tesis doctoral:
Macías Guarasa, Javier. 2001. Arquitecturas y métodos en sistemas de
reconocimiento automático de habla de gran vocabulario. Escuela Técnica
Superior de Ingenieros de Telecomunicación, Universidad Politécnica de
Madrid (España):
http://www-gth.die.upm.es/~macias/tesis.pdf
____________________________________________________________________
1. Autor: Macías Guarasa, Javier
2. Título de la tesis:
Arquitecturas y métodos en sistemas de reconocimiento automático
de habla de gran vocabulario
2.1 Número de páginas:
2.2 Palabras clave:
3. Fecha de lectura: 30 de noviembre de 2001
4. Departamento, centro o laboratorio en el que se ha desarrollado
la tesis:
Grupo de Tecnología del Habla
Departamento de Ingeniería Electrónica
Escuela Técnica Superior de Ingenieros de Telecomunicación
Universidad Politécnica de Madrid (España)
5. Director de la tesis:
José Manuel Pardo Muñoz y Javier Ferreiros López
6. Proyecto o línea de investigación en el que se incluye:
Investigación y desarrollo en áreas relacionadas con el
procesamiento de habla: reconocimiento, síntesis, comprensión de
lenguaje, etc.
7. Resumen:
La presente tesis doctoral, se enmarca en el área del Reconocimiento
Automático de Habla y específicamente en el diseño de sistemas de
reconocimiento de gran vocabulario. En todos los casos, la tecnología de
base en lo que se refiere al modelado, la aportan los modelos ocultos de
Markov que, hoy por hoy, representan el paradigma de modelado dominante.
En concreto, se utilizarán técnicas de modelado discreto y semicontinuo,
dependiente e independiente del contexto.
En primer lugar, y a partir de una clasificación de alternativas
arquitecturales en el diseño de sistemas de reconocimiento se hace un
estudio teórico de la formulación del comportamiento de arquitecturas
multi-módulo, tanto en coste computacional como en tasa de
reconocimiento, definiendo una metodología de diseño para determinar la
adecuación de módulos particulares de cara a su uso conjunto, que es
validada con la experimentación correspondiente.
Igualmente, se hace énfasis en el estudio y evaluación de algunas de
las alternativas de compresión del espacio de búsqueda, estableciendo
relaciones de compromiso entre coste y tasa, que es el binomio decisivo
a la hora de abordar el diseño de sistemas en tiempo real. Se presentan
estudios sobre distintas estrategias de organización del espacio de
búsqueda orientadas a exploración y búsqueda con algoritmos de
programación dinámica: árboles y grafos, deterministas y no
deterministas, proponiendo soluciones prometedoras para incrementar la
tasa de inclusión obtenible sobre estructuras de grafo (en las que la
compresión del espacio de búsqueda produce peores resultados que con la
búsqueda lineal o en árbol). Especialmente importante es el trabajo
sobre estimación de listas variables de preselección, analizando métodos
paramétricos y no paramétricos, centrándonos en el uso de redes
neuronales como mecanismo estimador. Se ha propuesto una metodología de
selección de parámetros de entrada, topologías y métodos de
codificación, en base a su potencia discriminativa en una tarea
simplificada. Dicha propuesta que ha sido ampliamente evaluada y
comparada con el enfoque tradicional de uso de listas fijas, mostrando
la consistente mejora tanto en tasa como en coste computacional
conseguible con el uso de redes neuronales. Dicho estudio sobre listas
variables ha sido extendido de forma natural al problema de estimación
de fiabilidad de hipótesis, habiéndose aprovechando estos resultados, de
nuevo, para la estimación de longitudes de listas, obteniendo también
buenos resultados.
En lo que respecta al repertorio de unidades de reconocimiento y a la
composición de los diccionarios usados (en cuanto al uso de múltiples
pronunciaciones), se aplican, evalúan y comparan métodos dirigidos por
datos y basados en conocimiento. En el apartado de introducción de
variantes de pronunciación se ha discutido ampliamente la problemática
de contar con bases de datos representativas y haciendo énfasis en la
importancia de atender y evaluar las mejoras marginales obtenidas con
algunos de estos métodos.
La evaluación de los resultados es planteada cuidadosamente, sobre
dos tareas radicalmente distintas: habla telefónica independiente del
locutor y habla aislada dependiente, ambas usando gran vocabulario
(hasta 10.000 palabras), lo que permite obtener conclusiones y claves de
diseño para cada una de ellas, con lo que se consigue una generalización
más fundamentada de su bondades o perjuicios. En este sentido se aplican
análisis de validez y relevancia estadística que pongan en su justo
sitio las mejoras o degradaciones observadas. En los procesos de
evaluación se han propuesto nuevas métricas y mecanismos originales de
comparación.
8. Dirección correo-e del autor:
Javier Macias Guarasa <macias at die.upm.es>
http://www-gth.die.upm.es/~macias/
9. Posibilidad de obtener un ejemplar:
Tesis completa en PDF:
http://www-gth.die.upm.es/~macias/tesis.pdf
____________________________________________________________________
Primer congreso sobre:
"LA CORRUPCIÓN EN LA UNIVERSIDAD PÚBLICA ESPAÑOLA":
http://www2.alcala.es/vivatacademia/treinta/congreso.htm
Temática del Congreso:
- análisis sobre el sistema público de investigación;
- denuncias de corrupción en el sistema de contratación;
- endogamia, corporativismo, plagio, convocatorias irregulares,
acoso institucional, prevaricación, etc.
Envío de contribuciones: gbalaclava at yahoo.es
-------------------------------------------------------------------
Información sobre la nueva Ley Orgánica de Universidades [de
España]: http://www.mec.es/leyuniv/index.html
--------------------------------------------------------------------
Infoling y Estudios de Lingüística Española http://elies.rediris.es
no reciben ayuda financiera o de otro tipo (becarios, etc.) de la
Universidad Autónoma de Barcelona (España), el centro universitario
desde donde se editan.
--------------------------------------------------------------------
----------------------------------------------------
Los artículos de INFOLING son distribuidos gracias al apoyo y colaboración
técnica de RedIRIS - Red Académica española - (http://www.rediris.es)
------------------------------------------------------
More information about the Infoling
mailing list