Adaptación de un sistema de búsqueda de palabras clave al castellano
Author
Xu, JunchenAdvisor
Toledano, Doroteo T.Entity
UAM. Departamento de Tecnología Electrónica y de las ComunicacionesDate
2014-10Subjects
Recuperación de la información; Voz, Tratamiento automático de la; Reconocimiento automático de la palabra; TelecomunicacionesEsta obra está bajo una licencia de Creative Commons Reconocimiento-NoComercial-SinObraDerivada 4.0 Internacional.
Abstract
El objetivo de este proyecto es el desarrollo e implementación de un sistema de búsqueda de palabras clave en castellano, partiendo de un sistema ya existente que funciona en inglés y vietnamita. La base de datos utilizada para entrenar y evaluar el sistema es el corpus Fisher Spanish, perteneciente al Consorcio de Datos Lingüísticos, con sede en Estados Unidos.
En primer lugar, se ofrece una breve explicación del sistema de producción del habla humano y el estado del arte en los campos de reconocimiento de voz y de palabras clave.
El sistema completo está compuesto por dos subsistemas que se encargan del reconocimiento de voz y búsqueda de palabras clave, respectivamente. El primero es el encargado de generar los lattices, sobre los que el segundo desarrollará la tarea de búsqueda. La modalidad de búsqueda de términos que se utiliza es la llamada Spoken Term Detection (STD).
Para evaluar el rendimiento del sistema, se han realizado pruebas de diferente naturaleza para los dos subsistemas. En esta memoria se recogen los resultados de esas pruebas y las conclusiones obtenidas. The objective of this project is to develop and implement a keyword spotting system in Spanish, based on an existing system that works in English and Vietnamese. The database used to train and evaluate the system is the Fisher Spanish corpus, belonging to the Linguistic Data Consortium, which is based in the United States.
First of all, a brief description of the human speech production system is provided, followed by the state of the art in speech recognition and keyword spotting.
The full system comprises two subsystems, responsible of speech recognition and keyword spotting, respectively. The former is in charge of generating lattices, which are used by the latter to search the keywords. The keyword spotting modality used is called Spoken Term Detection (STD).
In order to evaluate the system, different tests have been performed for the two subsystems. The results are captured in this document, as well as the conclusions.
Files in this item
Google Scholar:Xu, Junchen
This item appears in the following Collection(s)
Except where otherwise noted, this item's license is described as https://creativecommons.org/licenses/by-nc-nd/4.0/
Related items
Showing items related by title, author, creator and subject.
-
Estimación de confianza en la búsqueda de palabras clave en sistemas basados en transcripción fonética
Bautista Lozano, Miguel
2012 -
Desarrollo de un sistema de Búsqueda de Palabras Clave en voz mediante Ejemplos
Cortés Álvarez, Sergio
2020-04 -
Lena Constante. Experiencia carcelaria y búsqueda de la palabra liberadora en lengua francesa
Alfaro Amierio, Margarita
2016