Desarrollo de un sistema de Búsqueda de Palabras Clave en voz mediante Ejemplos
Author
Cortés Álvarez, SergioAdvisor
Toledano, Doroteo T.Entity
UAM. Departamento de Tecnología Electrónica y de las ComunicacionesDate
2020-04Subjects
Consulta; repositorio; reconocedor de voz; TelecomunicacionesEsta obra está bajo una licencia de Creative Commons Reconocimiento-NoComercial-SinObraDerivada 4.0 Internacional.
Abstract
Este Trabajo Fin de Grado, consiste y tiene como objetivo, la búsqueda de palabras clave en voz, es decir, el fin es buscar y detectar palabras en audios de larga duración a través de los datos de la voz.
Para ello, se han utilizado audios y consultas pertenecientes a la base de datos MAVIR, que anteriormente se han utilizado en evaluaciones de Albayzin Search on Speech.
A partir de esto, se ha desarrollado un sistema QbE STD (Query-by-Example Spoken Term Detection) con el que se han recuperado datos de un repositorio de voz a partir de la palabra de interés. A partir de los audios, las consultas y el reconocedor BUT (Brno University of Technology) para el reconocimiento de fonemas, se han extraído características cómo son los posteriorgramas fonéticos, que representan la probabilidad de cada fonema en cada instante de tiempo, con los que se ha obtenido una matriz de probabilidades a posteriori. Posteriormente, se ha desarrollado el algoritmo S-DTW (Subsequence – Dynamic Time Warping) cuyo objetivo es buscar un ejemplo de la palabra en el repositorio a través de un archivo de audio y hacerlo de forma rápida y precisa. A partir de dicho sistema, se han obtenido datos como el momento en el que se encuentra la consulta en el repositorio, la duración de dicha coincidencia, y la puntuación o score, que es la inversa del coste medio del camino óptimo encontrado para la consulta.
Finalmente, una vez obtenida la salida del sistema QbE STD en formato XML, se utilizará como entrada en el sistema scoring con el que obtendremos las métricas ATWV (Actual Term Weighted Vaue) y MTWV (Maximun Term Weighted Value), que son las métricas a optimizar.
Files in this item
Google Scholar:Cortés Álvarez, Sergio
This item appears in the following Collection(s)
Except where otherwise noted, this item's license is described as https://creativecommons.org/licenses/by-nc-nd/4.0/
Related items
Showing items related by title, author, creator and subject.
-
Detección de palabras clave en voz mediante ejemplos empleando redes neuronales profundas
Quintela Gironás, Juan Carlos
2019-06 -
Adaptación de un sistema de búsqueda de palabras clave al castellano
Xu, Junchen
2014-10 -
Estimación de confianza en la búsqueda de palabras clave en sistemas basados en transcripción fonética
Bautista Lozano, Miguel
2012