Sistemas de Reconocimiento Facial basados en Redes Neuronales Convolucionales usando Información de Género y Raza
Author
Simón Chico, JuliaAdvisor
Vera Rodríguez, RubénEntity
UAM. Departamento de Tecnología Electrónica y de las ComunicacionesDate
2021-06Subjects
Reconocimiento facial; Triplet loss; Redes neuronales convolucionales; InformáticaEsta obra está bajo una licencia de Creative Commons Reconocimiento-NoComercial-SinObraDerivada 4.0 Internacional.
Abstract
Una serie de estudios han demostrado que hay sesgos en los sistemas actuales de reconocimiento facial. La motivación principal de este trabajo es terminar con los sesgos de género y raza para conseguir tener una buena precisión en todos los grupos demográficos. Para lograrlo, el objetivo de este
trabajo es añadir información de género y etnia en estos sistemas para mejorar el rendimiento.
Para añadir información de género y etnia se plantea que sobre las redes neuronales convolucionales ya existentes, Resnet-50 y VGG16, previamente entrenadas en reconocimiento facial, se añada una capa de triplet loss. Esta capa se entrena únicamente con personas de un cierto género, una etnia
en concreto o una combinación de etnia y género concretos. Al entrenarla de esta forma, ese modelo se va a especializar en esa clase concreta, y por ello ese será el modelo que se utilizará para las personas que pertenezcan a ese grupo demográfico.
Para evaluar los resultados se utilizan diferentes bases de datos existentes que disponen de información de etnia o género. En concreto se utilizan VGGFace2, RFW y BUPT-Balancedface. Se ha observado que para las bases de datos de VGGFace2 y RFW los resultados eran satisfactorios, mejorando los resultados en casi todas las clases para ambos modelos base, con una disminución de aproximadamente un 2 % del EER, equal error rate, en algunas clases de Resnet50 y una reducción del EER mayor en VGG16, teniendo una disminución de un 4 % en el mejor de los casos. Para BUPTBalancedface, se han visto mejoras en algunos grupos pero no en todos. Además, después de realizar diferentes experimentos se ha concluido que el número de triplets que se generan para entrenar la red influye en que haya unos mejores resultados.
Sin embargo, a pesar de mejorar en ciertos grupos demográficos el resultado obtenido por los sistemas ya existentes, se ha visto que sigue habiendo diferencias entres los diferentes grupos, obteniendo siempre un mejor resultado para hombres caucásicos
Files in this item
Google Scholar:Simón Chico, Julia
This item appears in the following Collection(s)
Except where otherwise noted, this item's license is described as https://creativecommons.org/licenses/by-nc-nd/4.0/
Related items
Showing items related by title, author, creator and subject.
-
Desarrollo de un sistema de reconocimiento de habla natural basado en redes neuronales profundas
Camacho Costumero, Carolina
2016-09 -
Estimación automática de atributos corporales usando redes neuronales convolucionales
Cuesta Hierro, Helena
2020-09