UAM | UAM_Biblioteca | Buscador único | Portal de Producción Científica | Repositorio de Datos de Investigación UAM
Biblos-e Archivo
    • español
    • English
  • español 
    • español
    • English
  • Identificarse
JavaScript is disabled for your browser. Some features of this site may not work without it.

Buscar en Biblos-e Archivo

Búsqueda avanzada

Listar

Todo Biblos-e ArchivoComunidades y coleccionesPor fecha de publicaciónAutoresTítulosMateriasFacultadesEsta colecciónPor fecha de publicaciónAutoresTítulosMateriasFacultades

Mi cuenta

IdentificarseRegistro

Estadísticas

Ver Estadísticas de uso

Ayuda

Guía sobre el repositorio de la UAMQuiero depositar mi trabajoPreguntas frecuentes

UAM_Biblioteca

Ver ítem 
  •   Biblos-e Archivo
  • 1 - Producción científica en acceso abierto de la UAM
  • Producción científica en acceso abierto de la UAM
  • Ver ítem
  •   Biblos-e Archivo
  • 1 - Producción científica en acceso abierto de la UAM
  • Producción científica en acceso abierto de la UAM
  • Ver ítem

Semantic-aware scene recognition

Autor (es)
López Cifuentes, AlejandroAutoridad UAM; Escudero Viñolo, MarcosAutoridad UAM; Bescos Cano, JesúsAutoridad UAM; García Martín, ÁlvaroAutoridad UAM
Entidad
UAM. Departamento de Tecnología Electrónica y de las Comunicaciones
Editor
Elsevier
Fecha de edición
2020-06-01
Cita
10.1016/j.patcog.2020.107256
López-Cifuentes, A.; Escudero-Viñolo, M.; Bescós, J.; García-Martín, Á. (2020) Semantic-aware scene recognition, 152, 107256.
 
 
 
ISSN
0031-3203
DOI
10.1016/j.patcog.2020.107256
Financiado por
This study has been partially supported by the Spanish Government through its TEC2017-88169-R MobiNetVideo project
Proyecto
Gobierno de España. TEC2017-88169-R
Versión del editor
https://doi.org/10.1016/j.patcog.2020.107256
Materias
Convolutional neural networks; Deep learning; Scene recognition; Semantic segmentation; Telecomunicaciones
URI
http://hdl.handle.net/10486/706166
Derechos
© 2020 Elsevier Ltd.

Licencia de Creative Commons
Esta obra está bajo una licencia de Creative Commons Reconocimiento-NoComercial-SinObraDerivada 4.0 Internacional.

Resumen

Scene recognition is currently one of the top-challenging research fields in computer vision. This may be due to the ambiguity between classes: images of several scene classes may share similar objects, which causes confusion among them. The problem is aggravated when images of a particular scene class are notably different. Convolutional Neural Networks (CNNs) have significantly boosted performance in scene recognition, albeit it is still far below from other recognition tasks (e.g., object or image recognition). In this paper, we describe a novel approach for scene recognition based on an end-to-end multi-modal CNN that combines image and context information by means of an attention module. Context information, in the shape of a semantic segmentation, is used to gate features extracted from the RGB image by leveraging on information encoded in the semantic representation: the set of scene objects and stuff, and their relative locations. This gating process reinforces the learning of indicative scene content and enhances scene disambiguation by refocusing the receptive fields of the CNN towards them. Experimental results on three publicly available datasets show that the proposed approach outperforms every other state-of-the-art method while significantly reducing the number of network parameters. All the code and data used along this paper is available at: https://github.com/vpulab/Semantic-Aware-Scene-Recognition
Mostrar el registro completo del ítem

Lista de ficheros

Thumbnail
Nombre
semantic_lopez-cifuentes_PR_2020_pre.pdf
Tamaño
6.969Mb
Formato
PDF

Refworks Export

Google™ Scholar:López Cifuentes, Alejandro - Escudero Viñolo, Marcos - Bescos Cano, Jesús - García Martín, Álvaro

Lista de colecciones del ítem

  • Producción científica en acceso abierto de la UAM [17185]

Registros relacionados

Mostrando ítems relacionados por título, autor, creador y materia.

  • Semantic-driven multi-camera pedestrian detection 

    López Cifuentes, AlejandroAutoridad UAM; Escudero Viñolo, MarcosAutoridad UAM; Bescos Cano, JesúsAutoridad UAM; Carballeira López, PabloAutoridad UAM
    2022-05-01
  • Automatic semantic parsing of the ground-plane in scenarios recorded with multiple moving cameras 

    López Cifuentes, AlejandroAutoridad UAM; Escudero Viñolo, MarcosAutoridad UAM; Bescos Cano, JesúsAutoridad UAM
    2018-08-17
  • Towards automatic waste containers management in cities via computer vision: containers localization and geo-positioning in city maps 

    Moral De Eusebio, PaulaAutoridad UAM; García Martín, ÁlvaroAutoridad UAM; Escudero Viñolo, MarcosAutoridad UAM; Martínez Sánchez, José MaríaAutoridad UAM; Bescos Cano, JesúsAutoridad UAM; Peñuela, Jesús; Martínez, Juan Carlos; Alvis, Gonzalo
    2022-08-16
Todos los documentos de Biblos-e Archivo están protegidos por derechos de autor. Algunos derechos reservados.
Universidad Autónoma de Madrid. Biblioteca
Contacto | Sugerencias
Estamos enFacebookCanal BiblosYouTubeTwitterPinterestWhatsappInstagram

Declaración de accesibilidad

 

 

Todos los documentos de Biblos-e Archivo están protegidos por derechos de autor. Algunos derechos reservados.
Universidad Autónoma de Madrid. Biblioteca
Contacto | Sugerencias
Estamos enFacebookCanal BiblosYouTubeTwitterPinterestWhatsappInstagram

Declaración de accesibilidad