Estudio y aplicación de redes neuronales a predicción de hashtags en dominios cruzados
Entity
UAM. Departamento de Ingeniería InformáticaDate
2019-06Subjects
Dominio; Red neuronal; Hashtag; InformáticaEsta obra está bajo una licencia de Creative Commons Reconocimiento-NoComercial-SinObraDerivada 4.0 Internacional.
Abstract
Las redes sociales son a día de hoy usadas por gran cantidad de personas debido a la facilidad con
la que permiten conocer gente o para enterarse de las últimas noticias. En estos tiempos, sobre todo
entre la gente joven, es poco habitual ver a gente sin cuenta en dominios como Instagram o Twitter.
Además, esta también es una oportunidad para las grandes compañías que quieren aprovechar la
información que proporcionan estos dominios para hacer recomendaciones más personalizadas a sus
nuevos usuarios.
Este Trabajo de Fin de Grado consiste en el estudio y aplicación de algoritmos de aprendizaje
automático como redes neuronales y vecinos próximos para la predicción de hashtags en dominios
cruzados y su posterior evaluación. Se utilizarán algoritmos de aprendizaje supervisado, empleándose
los datos de Instagram para la fase de entrenamiento y los datos de Twitter para la de test. Esto
nos permitirá conocer en qué medida el vocabulario activo de un usuario en un dominio es similar al
vocabulario utilizado en otro distinto.
Por otro lado, hemos estudiado el subtitulado de imágenes, las técnicas más extendidas a día de
hoy y las métricas más utilizadas en este ámbito. Hemos generado varios tipos de algoritmos KNN
para ver su potencial en sus distintas versiones y hemos utilizado una librería de redes neuronales
para ver su potencial frente a estos algoritmos. Para conseguir los usuarios de test de Twitter se han
identificado en primer lugar los usuarios de Instagram y después se ha comprobado si el nombre del
usuario era el mismo para descargar toda esta información, se ha realizado un preprocesado de los
datos y, por último, se han formado los distintos ficheros de test para su evaluación.
Como conclusión, hemos observado que la red neuronal utilizada en sus distintas versiones es
superior a los algoritmos KNN, aunque en algunos casos no con mucha diferencia. Aquellos usuarios
que utilizábamos en los datos de entrenamiento y que luego aparecían en los de test aún siendo dominios
distintos daban muy buenos resultados en la predicción de hashtags, esto nos indica que existe
una alta correlación en el vocabulario de un usuario en ambos dominios ya que si está condición no
se cumplía los resultados disminuían en un 45 %. Por último, señalar que esta tendencia se cumple e
incluso mejora con usuarios que poseen mayor cantidad de imágenes, siempre y cuando se cumpla
que el usuario aparezca en la fase de entrenamiento.
Files in this item
Google Scholar:Sánchez-Guzmán Hitti, Ricardo
This item appears in the following Collection(s)
Except where otherwise noted, this item's license is described as https://creativecommons.org/licenses/by-nc-nd/4.0/
Related items
Showing items related by title, author, creator and subject.
-
Nuevas aproximaciones computacionales para el estudio y la predicción funcional de dominios de proteínas
López López, Daniel
2013-09-23 -
Explotación de características de secuencias para su uso en sistemas de recomendación
Sánchez-Guzmán Hitti, Ricardo
2020-09 -
Control of a hippocampal recurrent excitatory circuit by cannabinoid receptor-interacting protein Gap43
Maroto, Irene B.; Costas Insua, Carlos; Berthoux, Coralie; Moreno, Estefanía; Ruiz Calvo, Andrea; Montero Fernández, Carlos; Macías Camero, Andrea; Martín, Ricardo; García Font, Nuria; Sánchez-Prieto, José; Marsicano, Giovanni; Bellocchio, Luigi; Canela, Enric I.; Casadó, Vicent; Galve Roperh, Ismael; Núñez Molina, Ángel; Fernández de Sevilla García, David; Rodríguez-Crespo, Ignacio; Castillo, Pablo E.; Guzmán, Manuel
2023-04-21