UAM | UAM_Biblioteca | Buscador único | Portal de Producción Científica | Repositorio de Datos de Investigación UAM
Biblos-e Archivo
    • español
    • English
  • español 
    • español
    • English
  • Identificarse
JavaScript is disabled for your browser. Some features of this site may not work without it.

Buscar en Biblos-e Archivo

Búsqueda avanzada

Listar

Todo Biblos-e ArchivoComunidades y coleccionesPor fecha de publicaciónAutoresTítulosMateriasFacultadesEsta colecciónPor fecha de publicaciónAutoresTítulosMateriasFacultades

Mi cuenta

IdentificarseRegistro

Estadísticas

Ver Estadísticas de uso

Ayuda

Guía sobre el repositorio de la UAMQuiero depositar mi trabajoPreguntas frecuentes

UAM_Biblioteca

Ver ítem 
  •   Biblos-e Archivo
  • 1 - Producción científica en acceso abierto de la UAM
  • Producción científica en acceso abierto de la UAM
  • Ver ítem
  •   Biblos-e Archivo
  • 1 - Producción científica en acceso abierto de la UAM
  • Producción científica en acceso abierto de la UAM
  • Ver ítem

Exploiting semantic segmentation to boost reinforcement learning in video game environments

Autor (es)
Montalvo Rodrigo, Javier; García Martín, ÁlvaroAutoridad UAM; Bescos Cano, JesúsAutoridad UAM
Entidad
UAM. Departamento de Tecnología Electrónica y de las Comunicaciones
Editor
Springer
Fecha de edición
2022-09-15
Cita
10.1007/s11042-022-13695-1
Multimedia Tools and Applications (2022): 1-19
 
 
 
ISSN
1380-7501 (print); 1573-7721 (online)
DOI
10.1007/s11042-022-13695-1
Financiado por
Open Access funding provided thanks to the CRUE-CSIC agreement with Springer Nature. This work is part of the preliminary tasks related to the Harvesting Visual Data (HVD) project (PID2021- 125051OB-I00) funded by the Ministerio de Ciencia e Innovacin of the Spanish Government
Proyecto
Gobierno de España. PID2021-125051OB-I00
Versión del editor
https://doi.org/10.1007/s11042-022-13695-1
Materias
Semantic segmentation; Reinforcement learning; Domain adaptation; Synthetic data; Electrónica; Telecomunicaciones
URI
http://hdl.handle.net/10486/704109
Nota
The version of record of this article, first published in Multimedia Tools and Applications , is available online at Publisher’s website: http://dx.doi.org/10.1007/s11042-022-13695-1
Derechos
© The Author(s) 2022

Licencia Creative Commons
Esta obra está bajo una Licencia Creative Commons Atribución 4.0 Internacional.

Resumen

In this work we explore enhancing performance of reinforcement learning algorithms in video game environments by feeding it better, more relevant data. For this purpose, we use semantic segmentation to transform the images that would be used as input for the reinforcement learning algorithm from their original domain to a simplified semantic domain with just silhouettes and class labels instead of textures and colors, and then we train the reinforcement learning algorithm with these simplified images. We have conducted different experiments to study multiple aspects: feasibility of our proposal, and potential benefits to model generalization and transfer learning. Experiments have been performed with the Super Mario Bros video game as the testing environment. Our results show multiple advantages for this method. First, it proves that using semantic segmentation enables reaching higher performance than the baseline reinforcement learning algorithm without modifying the actual algorithm, and in fewer episodes; second, it shows noticeable performance improvements when training on multiple levels at the same time; and finally, it allows to apply transfer learning for models trained on visually different environments. We conclude that using semantic segmentation can certainly help reinforcement learning algorithms that work with visual data, by refining it. Our results also suggest that other computer vision techniques may also be beneficial for data prepossessing. Models and code will be available on github upon acceptance
Mostrar el registro completo del ítem

Lista de ficheros

Thumbnail
Nombre
exploiting_montalvo_multimed_tools_appl_2022.pdf
Tamaño
2.682Mb
Formato
PDF
Descripción
Artículo

Refworks Export

Google™ Scholar:Montalvo Rodrigo, Javier - García Martín, Álvaro - Bescos Cano, Jesús

Lista de colecciones del ítem

  • Producción científica en acceso abierto de la UAM [18125]

Registros relacionados

Mostrando ítems relacionados por título, autor, creador y materia.

  • DiVA: A Distributed Video Analysis framework applied to video-surveillance systems 

    San Miguel Avedillo, Juan CarlosAutoridad UAM; Bescos Cano, JesúsAutoridad UAM; Martínez Sánchez, José MaríaAutoridad UAM; García Martín, ÁlvaroAutoridad UAM
    2008
  • Semantic-aware scene recognition 

    López Cifuentes, AlejandroAutoridad UAM; Escudero Viñolo, MarcosAutoridad UAM; Bescos Cano, JesúsAutoridad UAM; García Martín, ÁlvaroAutoridad UAM
    2020-06-01
  • Semantic Segmentation in 2D Videogames 

    Montalvo Rodrigo, Javier
    2021-06
Todos los documentos de Biblos-e Archivo están protegidos por derechos de autor. Algunos derechos reservados.
Universidad Autónoma de Madrid. Biblioteca
Contacto | Sugerencias
Estamos enFacebookCanal BiblosYouTubeTwitterPinterestWhatsappInstagram

Declaración de accesibilidad

 

 

Todos los documentos de Biblos-e Archivo están protegidos por derechos de autor. Algunos derechos reservados.
Universidad Autónoma de Madrid. Biblioteca
Contacto | Sugerencias
Estamos enFacebookCanal BiblosYouTubeTwitterPinterestWhatsappInstagram

Declaración de accesibilidad