Mejoras de un sistema de búsquedas en voz y aplicación a detección de menciones en medios de comunicación
Advisor
Toledano, Doroteo T.Entity
UAM. Departamento de Tecnología Electrónica y de las ComunicacionesDate
2016-05Subjects
Reconocimiento automático de la palabra; Voz, Tratamiento automático de la; TelecomunicacionesEsta obra está bajo una licencia de Creative Commons Reconocimiento-NoComercial-SinObraDerivada 4.0 Internacional.
Abstract
Las menciones publicitarias son contenidos publicitarios no pregrabados que habitualmente dicen los locutores de radio o TV para promocionar un producto o empresa. La dificultad de la detección de menciones publicitarias consiste en que el audio no se repite igual cada vez, como ocurre con los anuncios publicitarios convencionales, donde se pueden emplear técnicas más efectivas como las de audio fingerprinting. Este Trabajo Fin de Grado propone la utilización de un sistema de búsqueda de palabras clave en castellano para la detección de menciones publicitarias.
En principio el TFG tenía como objetivo mejorar un sistema de búsqueda de palabras claves en castellano para aplicarlo a la detección de menciones publicitarias. Finalmente se ha construido un sistema nuevo prácticamente desde cero. Para ello ha sido necesario en primer lugar entrenar y evaluar un nuevo reconocedor de voz en español empleando la herramienta Kaldi y las bases de datos Fisher Spanish y Calhome Spanish. Con este proceso se ha conseguido reducir la tasa de erro de palabra del 49.88% que se obtenía con el anterior reconocedor en español del grupo ATVS al 41.10% sobre voz conversacional telefónica.
Para la evaluación de detección de menciones a través de palabras clave se ha creado también como parte de este TFG y en colaboración con otros estudiantes de TFG del grupo, una base de datos en castellano, que hemos denominado ATVS-Radio, que contiene unas 300 horas de audio, de las cuales 25 horas han sido etiquetadas con varias informaciones. En particular para este trabajo se han etiquetado las 62 menciones publicitarias que aparecían. Para la detección de menciones se ha modificado el léxico del reconocedor para incluir 51 palabras clave a detectar en las menciones y se ha aplicado el reconocedor a todas las menciones publicitarias, consiguiendo detectar cerca de un 74% de las mismas. Este resultado todavía podría mejorase sustancialmente porque es posible realizar una mejor adaptación del reconocedor a la tarea, en particular adaptando el modelo de lenguaje que no ha sido modificado para la detección de palabras clave.
Files in this item
Google Scholar:Fernández Gallego, María Pilar
This item appears in the following Collection(s)
Except where otherwise noted, this item's license is described as https://creativecommons.org/licenses/by-nc-nd/4.0/
Related items
Showing items related by title, author, creator and subject.
-
Genetic landscape of 6089 inherited retinal dystrophies affected cases in Spain and their therapeutic and extended epidemiological implications
Perea-Romero, Irene; Gordo, Gema; Iancu, Ionut F.; Del Pozo-Valero, Marta; Almoguera, Berta; Blanco-Kelly, Fiona; Carreño, Ester; Jimenez-Rolando, Belen; Lopez-Rodriguez, Rosario; Lorda-Sanchez, Isabel; Martin-Merida, Inmaculada; Pérez de Ayala, Lucia; Riveiro-Alvarez, Rosa; Rodriguez-Pinilla, Elvira; Tahsin-Swafiri, Saoud; Trujillo-Tiebas, Maria J.; Bustamante-Aragones, Ana; Cardero-Merlo, Rocio; Fernandez-Sanchez, Ruth; Gallego-Merlo, Jesus; Garcia-Vara, Ines; Gimenez-Pardo, Ascension; Horcajada-Burgos, Laura; Infantes-Barbero, Fernando; Lantero, Esther; Lopez-Martinez, Miguel A.; Martinez-Ramas, Andrea; Ondo, Lorena; Rodriguez de Alba, Marta; Sanchez-Jimeno, Carolina; Velez-Monsalve, Camilo; Villaverde, Cristina; Zurita, Olga; Aguilera-Garcia, Domingo; Aguirre-Lamban, Jana; Arteche, Ana; Cantalapiedra, Diego; Fernandez-San Jose, Patricia; Galbis-Martinez, Liliana; Garcia-Hoyos, Maria; Lombardia, Carlos; Lopez-Molina, Maria I.; Perez-Carro, Raquel; Da Silva, Luciana R.J.; Ramos, Carmen; Sanchez-Alcudia, Rocio; Sanchez-Navarro, Iker; Tatu, Sorina D.; Vallespin, Elena; Aller, Elena; Bernal, Sara; Gamundi, Maria J.; Garcia-Garcia, Gema; Hernan, Inmaculada; Jaijo, Teresa; Antiñolo, Guillermo; Baiget, Montserrat; Carballo, Miguel; Millan, Jose M.; Valverde, Diana; Allikmets, Rando; Banfi, Sandro; Cremers, Frans P.M.; Collin, Rob W.J.; De Baere, Elfride; Hakonarson, Hakon; Kohl, Susanne; Rivolta, Carlo; Sharon, Dror; Alonso-Cerezo, Maria C.; Ballesta-Martinez, Maria J.; Beltran, Sergi; Benito Lopez, Carmen; Català-Mora, Jaume; Catalli, Claudio; Cotarelo-Perez, Carmen; Fernandez-Burriel, Miguel; Fontalba-Romero, Ana; Galán-Gómez, Enrique; Garcia-Barcina, Maria; Garcia-Cruz, Loida M.; Gener, Blanca; Gil-Fournier, Belen; Govea, Nancy; Guillen-Navarro, Encarna; Hernando Acero, Ines; Irigoyen, Cristina; Izquierdo-Álvarez, Silvia; Llano-Rivas, Isabel; López-Ariztegui, Maria A.; Lopez-Gonzalez, Vanesa; Lopez-Grondona, Fermina; Martorell, Loreto; Mendez-Perez, Pilar; Moreno-Igoa, Maria; Oancea-Ionescu, Raluca; Palau-Martinez, Francesc; Perez de Nanclares, Guiomar; Ramos-Fuentes, Feliciano J.; Rodriguez-Lopez, Raquel; Ayuso García, María del Carmen Tomasa
2021-12-01 -
La comprensión del ritmo histórico a través del análisis de un acontecimiento. Medios de comunicación/ciencias sociales/actualidad.
Rodríguez Flores, María Pilar
1998 -
La posible aplicación de los principios de competencia y buena regulación a la universidad en España. En búsqueda de la excelencia
Canedo Arrillaga, María Pilar
2020