Recomendación basada en procesos de decisión de Markov
Author
Pertejo Mangas, AdriánAdvisor
Castells Azpilicueta, PabloEntity
UAM. Departamento de Ingeniería InformáticaDate
2020-06Subjects
Recuperación de Información; Sistemas de Recomendación; Aprendizaje por Refuerzo; InformáticaNote
Trabajo Fin de Máster en Investigación e Innovación en Tecnologías de la Información y las ComunicacionesEsta obra está bajo una licencia de Creative Commons Reconocimiento-NoComercial-SinObraDerivada 4.0 Internacional.
Abstract
En los últimos años, el campo del Aprendizaje por Refuerzo
(Reinforcement Learning) ha adquirido una relevancia notoria en múltiples áreas de
estudio. Mediante la propuesta de un paradigma de aprendizaje interactivo, busca modelar
la idea del aprendizaje natural que tiene un ser vivo en relación con su entorno. En la
literatura, se ha empezado a trabajar en la integración de este nuevo área con problemas
clásicos de Machine Learning, y entre ellos, la recomendación no es una excepción.
Durante este trabajo, se ha realizado un estudio del campo del Reinforcement Learning,
con la intención de comprender cómo funcionan estos algoritmos, y poder proponer un
sistema de recomendación basado en él. A partir de este estudio, se transita al desarrollo
de un sistema basado en Deep Q-Learning, uno de los algoritmos más prometedores
del campo, que utiliza una red neuronal como aproximador para estimar la función de
valor. Además, usando factorización de matrices, extraemos las características latentes
de usuarios y objetos, y las usamos para modelar los estados del agente, guiándonos por
propuestas ya presentadas en la literatura.
Una vez desarrollado el sistema, realizamos experimentos con el objetivo de, primero,
evaluar la efectividad de diferentes estrategias de Deep Q-Learning, utilizando un conjunto
de datos que representa un arranque en frío, donde hay pocos datos de entrenamiento.
Por último, comparamos el rendimiento de la estrategia más interesante del paso anterior,
con otros algoritmos clásicos de recomendación, basados en filtrado colaborativo: vecinos
próximos, factorización de matrices, etc.
Files in this item
Google Scholar:Pertejo Mangas, Adrián
This item appears in the following Collection(s)
Except where otherwise noted, this item's license is described as https://creativecommons.org/licenses/by-nc-nd/4.0/
Related items
Showing items related by title, author, creator and subject.
-
Aprendizaje activo en Sistemas de Recomendación
Pertejo Mangas, Adrián
2018-06 -
Crawlers basados en reinforcement learning
Pertejo Mangas, Adrián
2021-01