Desarrollo de un sistema de reconimiento de habla natural independiente del locutor
Author
Antón Martín, JavierEntity
UAM. Departamento de Tecnología Electrónica y de las ComunicacionesDate
2015-03Subjects
Lenguaje natural (Informática); Voz, Tratamiento automático de la; TelecomunicacionesEsta obra está bajo una licencia de Creative Commons Reconocimiento-NoComercial-SinObraDerivada 4.0 Internacional.
Abstract
El objetivo de este proyecto es diseñar un sistema de reconocimiento de habla
continua de gran vocabulario (LVCRS) utilizando modelos ocultos de Markov (HMM).
Una vez conseguido, se procederá a mejorarlo aplicando diversas técnicas, como el
incremento del número de gaussianas de los HMM y la optimización del tamaño de
ventana de análisis para cada archivo de entrada.
También se intentarán deducir otra serie de parámetros como cuál es la ventana
de análisis óptima para un reconocimiento genérico de voz y cuál es el número óptimo
de archivos de entrenamiento necesarios. Asimismo, se realizarán pruebas de reconocimiento
sobre contenidos audiovisuales obtenidos de Internet, para probar cómo
reacciona el sistema en un entorno menos controlado.
Una vez creado, mejorado el sistema y medida su capacidad de reconocer vídeos de
Internet, se procederá a integrar sus capacidades en un producto comercial dedicado a
la búsqueda avanzada de contendios dentro de vídeos de Internet, utilizando el texto
reconocido por el sistema para añadir posibilidades de búsqueda avanzada sobre los
vídeos. The goal of this project was the implementation of a large vocabulary continuous
speech recognition system (LVCRS) using hidden Markov models (HMM). Once implemented,
the next step regarded the improvement of its different parameters, such
as the number of gaussians of the HMM or the choice of the analysis window size for
each input file.
The best analysis window for generic voice recognition and the optimal number
of training files needed for this process were deducted as well.
Once finished, more tests were performed on audiovisual content obtained from
Internet in order to verify how the system works in a less controlled environment.
Finally, its abilities were tested so that it can be integrated in a commercial
product, used for speech recognition on Internet videos with the aim of using the
recognized text to add new advanced search capabilities on these videos.
Files in this item
Google Scholar:Antón Martín, Javier
This item appears in the following Collection(s)
Except where otherwise noted, this item's license is described as https://creativecommons.org/licenses/by-nc-nd/4.0/
Related items
Showing items related by title, author, creator and subject.
-
Desarrollo de un sistema de reconocimiento de habla natural para transcribir contenidos de audio en internet
Perero Codosero, Juan Manuel
2015-03 -
Desarrollo de un sistema de reconocimiento de habla natural basado en redes neuronales profundas
Camacho Costumero, Carolina
2016-09 -
Diseño y desarrollo de un sistema de reconocimiento de comandos basado en el uso de BCI para personas con disfuncionalidad motora y del habla
Roncero Penistone, Ryan Aiden
2015-07