Búsqueda y extracción de información en Audio Mining
Entity
UAM. Departamento de Ingeniería InformáticaDate
2006Citation
IADIS International Conference WWW/Internet 2006. IADIS, 2006Subjects
Audio Mining; Broadcast News; Word Spotting; Reconocimiento de voz; TelecomunicacionesNote
Versión electrónica de la ponencia presentada en el IADIS International Conference on WWW / Internet 2006, celebrado en Murcia
Esta obra está bajo una licencia de Creative Commons Reconocimiento-NoComercial-SinObraDerivada 4.0 Internacional.
Abstract
En este artículo vamos a presentar un sistema que actualmente se está desarrollando y que engloba a las etapas del proceso del “Audio Mining”. Mediante el mismo, una persona podrá realizar búsquedas entre los ficheros de audio que estén en un determinado repositorio con objeto de extraer de éste aquellos ficheros que contengan información relacionada con las palabras o temas que desee. Así, no es necesario que dicha persona oiga todos los ficheros que están en el repositorio para recoger dicha información, reduciéndose así sobremanera el tiempo de respuesta en el acceso a la información. Este sistema se basa en una primera trascripción off-line de los ficheros de audio del repositorio y su posterior indexación (que solo se realizará una vez), para lo cual es necesario desarrollar un reconocedor de voz de habla continua y de gran vocabulario con el que podamos reconocer el máximo número de palabras, y una posterior presentación total o parcial de los ficheros que cumplan los criterios de búsqueda del usuario. En una primera fase se está desarrollando un reconocedor de habla continua basado en palabras clave (Word Spotting) de tal forma que la búsqueda se hará únicamente sobre las palabras clave que se definan desde un principio, lo cual conllevará menos errores a la hora de devolver la información solicitada. Más adelante, se ampliará este reconocedor para que se intente obtener la trascripción completa de todo el texto correspondiente al fichero de audio y poder realizar así búsquedas más detalladas. También se incorporarán algoritmos de segmentación y etiquetado de los ficheros de audio que ya hemos desarrollado y que pertenecen a las primeras etapas del Audio Mining.
Files in this item
Google Scholar:Tejedor Noguerales, Javier
-
Bolaños Alonso, Daniel
-
Garrido Salas, Javier
-
Colás Pasamontes, José
This item appears in the following Collection(s)
Related items
Showing items related by title, author, creator and subject.