Desarrollo de un sistema de búsquedas en voz basadas en ejemplos

Aguirre Villar, María Begoña

UAM_Biblioteca

Mañana, JUEVES, 24 DE ABRIL, el sistema se apagará debido a tareas habituales de mantenimiento a partir de las 9 de la mañana. Lamentamos las molestias.

Show simple item record

dc.contributor.advisor	Toledano, Doroteo T.
dc.contributor.author	Aguirre Villar, María Begoña
dc.contributor.other	UAM. Departamento de Tecnología Electrónica y de las Comunicaciones	es_ES
dc.date.accessioned	2017-08-10T18:31:59Z
dc.date.available	2017-08-10T18:31:59Z
dc.date.issued	2017-06
dc.identifier.uri	http://hdl.handle.net/10486/679340
dc.description.abstract	En la actualidad existen diversas técnicas para implementar un sistema de búsqueda en voz. En este TFG se describe el desarrollo de un sistema de búsqueda en voz basadas en ejemplos usando el método QbE - STD (Query-by-Example – Spoken Detection Term). El sistema se ajusta a las condiciones de la evaluación ALBAYZIN 2016, es decir, se usan los mismos recursos (archivos) que son proporcionados para los participantes y se despliega uno de los sistemas propuestos. El sistema QbE – STD tiene como objetivo encontrar un término (consulta) en un repositorio (documento). Sin embargo, en lugar de usar palabras o fonemas en formato de texto como términos de búsqueda, el sistema emplea fragmentos de audio como términos de búsqueda. Estos fragmentos, son las consultas y han de ser pre-procesadas. La fase de pre-procesamiento se basa esencialmente en la extracción de características. Conjuntamente los documentos han de pasar por este mismo proceso. La técnica adoptada para la extracción de características debido a sus buenos resultados es la de probabilidades a posteriori de fonemas. Estas son obtenidas a través de un reconocedor fonético. Por otro lado, otra fase fundamental en el desarrollo del sistema es la implementación de un algoritmo de comparación. Se ha implementado el algoritmo S-DTW (DTW de Subsecuencias) el cual es una variante del algoritmo original de alineamiento temporal dinámico (DTW). El algoritmo decide si la consulta se encuentra en el documento o no. En caso afirmativo, nos proporciona los instantes de tiempo en los cuales comienza y termina una posible detección de la consulta dentro de la base de datos. En añadidura se devuelve la puntuación de la detección. Finalmente; se realizan una serie de pruebas y resultados para evaluar la eficacia del sistema.	es_ES
dc.description.abstract	Nowadays, there are available several techniques for the development of a voice search system. In this Bachelor Thesis, we describe a voice search system based on examples employing the QbE – STD (Query-by-Example – Spoken Detection Term) approach. This system satisfies the ALBAYZIN 2016 evaluation conditions, in other words, the system makes use of the same resources (audio files) that were provided for the participants. Furthermore, one of the proposed systems is deployed. The aim of the QbE - STD system is to detect a term (query) in an audio database. Nevertheless, instead of using words or some phonemes in a text format as search terms, the system uses audio fragments as search terms. This audio fragments are the queries, and they must be pre-processed. The pre-processing step is essentially based on the feature extraction. Jointly, the audio database must go through this same process. The phoneme posteriorgrams is the feature extraction approach, this choice is due to its excellent results on the evaluation. These are obtained using phoneme decoders. On the other hand, it is indispensable the implementation of a searching algorithm. The chosen algorithm is the subsequence DTW, a variant of the classic DTW approach. The algorithm decides whether the query is in the audio database or not. If the query is found, it returns the boundaries (the beginning and the end) of the query in the audio database. In addition, the detection score is returned. Finally, several tests and results are performed to evaluate the system’s performance.	en_US
dc.format.extent	52 pág.	es_ES
dc.format.mimetype	application/pdf	en_US
dc.language.iso	spa	en_US
dc.rights.uri	https://creativecommons.org/licenses/by-nc-nd/4.0/
dc.subject.other	Búsqueda mediante ejemplo	es_ES
dc.subject.other	Reconocimiento de voz	es_ES
dc.subject.other	Alineamiento temporal dinámico	es_ES
dc.title	Desarrollo de un sistema de búsquedas en voz basadas en ejemplos	es_ES
dc.type	bachelorThesis	en_US
dc.subject.eciencia	Telecomunicaciones	es_ES
dc.rights.cc	Reconocimiento – NoComercial – SinObraDerivada	es_ES
dc.rights.accessRights	openAccess	en_US
dc.facultadUAM	Escuela Politécnica Superior

Files in this item

Name:: Aguirre_Villar_MariaBegona_tfg.pdf
Size:: 1.830Mb
Format:: PDF

This item appears in the following Collection(s)

Trabajos de estudiantes (tesis doctorales, TFMs, TFGs, etc.) [19985]

Show simple item record

Except where otherwise noted, this item's license is described as https://creativecommons.org/licenses/by-nc-nd/4.0/

UAM_Biblioteca

Desarrollo de un sistema de búsquedas en voz basadas en ejemplos

Files in this item

This item appears in the following Collection(s)

Related items

Desarrollo de un sistema de Búsqueda de Palabras Clave en voz mediante Ejemplos ﻿

Desarrollo de un sistema de análisis de imágenes usando información de redes sociales ﻿

Participación del sistema TWEAK/Fn 14 en la formación y desarrollo de la lesión aterosclerótica ﻿

Desarrollo de un sistema de Búsqueda de Palabras Clave en voz mediante Ejemplos

Desarrollo de un sistema de análisis de imágenes usando información de redes sociales

Participación del sistema TWEAK/Fn 14 en la formación y desarrollo de la lesión aterosclerótica