Show simple item record

dc.contributor.advisorToledano, Doroteo T.
dc.contributor.authorXu, Junchen
dc.contributor.otherUAM. Departamento de Tecnología Electrónica y de las Comunicacioneses_ES
dc.date.accessioned2014-11-13T14:08:18Z
dc.date.available2014-11-13T14:08:18Z
dc.date.issued2014-10
dc.identifier.urihttp://hdl.handle.net/10486/662527
dc.description.abstractEl objetivo de este proyecto es el desarrollo e implementación de un sistema de búsqueda de palabras clave en castellano, partiendo de un sistema ya existente que funciona en inglés y vietnamita. La base de datos utilizada para entrenar y evaluar el sistema es el corpus Fisher Spanish, perteneciente al Consorcio de Datos Lingüísticos, con sede en Estados Unidos. En primer lugar, se ofrece una breve explicación del sistema de producción del habla humano y el estado del arte en los campos de reconocimiento de voz y de palabras clave. El sistema completo está compuesto por dos subsistemas que se encargan del reconocimiento de voz y búsqueda de palabras clave, respectivamente. El primero es el encargado de generar los lattices, sobre los que el segundo desarrollará la tarea de búsqueda. La modalidad de búsqueda de términos que se utiliza es la llamada Spoken Term Detection (STD). Para evaluar el rendimiento del sistema, se han realizado pruebas de diferente naturaleza para los dos subsistemas. En esta memoria se recogen los resultados de esas pruebas y las conclusiones obtenidas.es_ES
dc.description.abstractThe objective of this project is to develop and implement a keyword spotting system in Spanish, based on an existing system that works in English and Vietnamese. The database used to train and evaluate the system is the Fisher Spanish corpus, belonging to the Linguistic Data Consortium, which is based in the United States. First of all, a brief description of the human speech production system is provided, followed by the state of the art in speech recognition and keyword spotting. The full system comprises two subsystems, responsible of speech recognition and keyword spotting, respectively. The former is in charge of generating lattices, which are used by the latter to search the keywords. The keyword spotting modality used is called Spoken Term Detection (STD). In order to evaluate the system, different tests have been performed for the two subsystems. The results are captured in this document, as well as the conclusions.en_US
dc.format.extent103 pág.es_ES
dc.format.mimetypeapplication/pdfen
dc.language.isospaen
dc.subject.otherRecuperación de la informaciónes_ES
dc.subject.otherVoz, Tratamiento automático de laes_ES
dc.subject.otherReconocimiento automático de la palabraes_ES
dc.titleAdaptación de un sistema de búsqueda de palabras clave al castellanoes_ES
dc.typebachelorThesisen
dc.subject.ecienciaTelecomunicacioneses_ES
dc.rights.ccReconocimiento – NoComercial – SinObraDerivadaes_ES
dc.rights.accessRightsopenAccessen
dc.facultadUAMEscuela Politécnica Superior


Files in this item

Thumbnail

This item appears in the following Collection(s)

Show simple item record