Deep learning aplicado al reconocimiento de locutor dependiente de texto
Author
Palomo Sánchez, ÁlvaroAdvisor
Toledano, Doroteo T.Entity
UAM. Departamento de Tecnología Electrónica y de las ComunicacionesDate
2019-06Subjects
Reconocimiento del locutor dependiente de texto; Verificación de locutor; Redes Neuronales; TelecomunicacionesNote
Máster en Ingeniería de TelecomunicaciónEsta obra está bajo una licencia de Creative Commons Reconocimiento-NoComercial-SinObraDerivada 4.0 Internacional.
Abstract
Este trabajo de fin de master tiene como objetivo el estudio, investigación e implementación de un sistema de reconocimiento de locutor dependiente de texto, para ello trabajaremos con la base de datos RSR2015, una base de datos destinada al estudio y desarrollo de estos sistemas.
En muchos de los sistemas de reconocimiento de locutor dependiente de texto se parte de un modelo general de locutores y se adapta este modelo a un modelo de locutor con las características específicas del mismo, por lo que hay que entrenar un modelo de locutor por cada uno de los locutores que tengamos. La idea de este trabajo es crear un sistema que generalice el reconocimiento de locutor sin un entrenamiento previo específico, vamos a crear un sistema innovador que nunca antes se había probado. Como veremos, se ha obtenido unos resultados más que aceptables, mejorando incluso resultados obtenidos en trabajos anteriores.
Para construir nuestro sistema primero extraeremos las características acústicas y fonéticas de los audios, como son los MFCCs o los posteriorgramas, para después combinarlos y extraer la correlación de Pearson frame a frame. Una vez que tenemos estas matrices de correlaciones usaremos redes neuronales para extraer las características locales de estas matrices de correlaciones.
Trabajaremos sobre un escenario en el que el locutor tiene que pronunciar una frase para autenticarse y el sistema decide si es un locutor genuino o un impostor. Trataremos de mejorar los resultados obtenidos en el TFG Mejoras en un sistema de reconocimiento de locutor dependiente de texto.
Files in this item
Google Scholar:Palomo Sánchez, Álvaro
This item appears in the following Collection(s)
Except where otherwise noted, this item's license is described as https://creativecommons.org/licenses/by-nc-nd/4.0/
Related items
Showing items related by title, author, creator and subject.
-
Mejoras en un sistema de reconocimiento del locutor dependiente de texto
Palomo Sánchez, Álvaro
2017-06 -
Reconocimiento del locutor dependiente del texto: Experimentos con la base de datos RSR2015
Mesa Castellanos, Álvaro
2016-05 -
Mejoras en el modelado acústico para reconocimiento de locutor dependiente de texto
Hernández López, Daniel
2008