Mañana, JUEVES, 24 DE ABRIL, el sistema se apagará debido a tareas habituales de mantenimiento a partir de las 9 de la mañana. Lamentamos las molestias.
Entrenamiento de un mini-robot para realizar tareas mediante aprendizaje automático
Author
Cabañas González, DanielAdvisor
Roldán Gómez, Juan JesúsEntity
UAM. Departamento de Ingeniería InformáticaDate
2021-05Subjects
Aprendizaje automático; Aprendizaje por refuerzo; Robótica; InformáticaEsta obra está bajo una licencia de Creative Commons Reconocimiento-NoComercial-SinObraDerivada 4.0 Internacional.
Abstract
El aprendizaje automático y las distintas áreas que lo comprenden están adquiriendo una gran relevancia en diversos campos profesionales y de investigación. Entre estas áreas se encuentra el aprendizaje por refuerzo, que tiene como objetivo el entrenar agentes para que aprendan y desarrollen comportamientos que les permita ejecutar de forma efectiva las tareas propuestas, utilizando sistemas de recompensas que premien o castiguen sus acciones y así condicionar sus comportamientos hasta perfeccionar sus resultados. Una de las aplicaciones más conocidas en el aprendizaje por refuerzo es el entrenamiento de robots para la realización de tareas sencillas, puesto que existe una fácil implementación de este área a los sistemas robóticos y porque los resultados de aprendizaje obtenidos son satisfactorios. En este proyecto se ha propuesto simular un modelo de robot real en el entorno de desarrollo Unity, y de entrenar esta simulación aplicando aprendizaje por refuerzo para que consiga resolver misiones de tipo exploración. A través de Unity se incluirá la librería ML-Agents, que permite el desarrollo con herramientas de aprendizaje automático de una forma muy versátil y cómoda. Sehantrabajado conredesneuronales, algoritmos de aprendizaje por refuerzo, sistemas de recompensas y gestión de entradas y salidas entre otras decisiones que han permitido desarrollar modelos capaces de solucionar entornos laberínticos. Los modelos de aprendizaje automático han entrenado en entornos simples y complejos, llegando a resolver laberintos de dimensiones 3x3 en aproximadamente 4 minutos durante los entrenamientos y siendo capaces de resolver laberintos de dimensiones 5x5 mediante generalización en aproximadamente 15 minutos sin haber entrenado en ellos previamente.
Files in this item
Google Scholar:Cabañas González, Daniel
This item appears in the following Collection(s)
Except where otherwise noted, this item's license is described as https://creativecommons.org/licenses/by-nc-nd/4.0/
Related items
Showing items related by title, author, creator and subject.
-
Aprendizaje multi-tarea mediante procesos gaussianos para clasificación
Velasco Pardo, Víctor
2017-01 -
Predicción de elecciones políticas mediante aprendizaje automático
Ajo Inglez, Pablo
2020-07 -
Predicción de Turismo en España mediante Aprendizaje Automático Concatenado a Datos Globales de la Pandemia
Guerra Reyes, Rodrigo
2021-06