dc.contributor.advisor | Menéndez, Héctor D. | |
dc.contributor.author | Delgado Calle, Carlos | |
dc.contributor.other | UAM. Departamento de Ingeniería Informática | es_ES |
dc.date.accessioned | 2016-01-20T13:22:09Z | |
dc.date.available | 2016-01-20T13:22:09Z | |
dc.date.issued | 2015-09 | |
dc.identifier.uri | http://hdl.handle.net/10486/669359 | |
dc.description | Máster en Ingeniería Informática | es_ES |
dc.description.abstract | En los últimos años, las redes sociales no han dejado de cobrar importancia. En especial
destaca Twitter, donde distintos usuarios comparten opiniones, noticias y todo tipo de contenido
multimedia. El conjunto de datos generado en las redes sociales contiene una gran cantidad de
información oculta a simple vista. Uno de los principales intereses de este trabajo es ordenar
dicha información de cara a poder facilitársela a los usuarios. Para ello, este trabajo pretende
evolucionar un modelo basado en meta-t opics, de tal forma que consiga una agrupación más
precisa que la actual. El anterior modelo hacía uso del análisis semántico para detectar un
único meta-topic a través de técnicas como LSA unidas a consultas semánticas a DBpedia,
para obtener resultados con los que poder analizar la validez del modelo. En este trabajo se
pretende mejorar dicho modelo dando un mayor peso a los valores obtenidos de DBpedia;
dichos valores permiten saber, de forma certera, si un término se relaciona con el meta-topic
deseado, pero en el diccionario no pueden encontrarse todos los términos; Por ello en este trabajo
se presenta un modelo basado en el uso de la métrica NGD (Normalized Google Distance),
que calcula las distancias entre términos para posteriormente generar, utilizando técnicas de
clustering, grupos de términos sobre los que poder propagar los valores de similitud obtenidos
en DBpedia. Finalmente, se expondrán los resultados obtenidos con los dos modelos (el original
y su evaluación) para comparar cual de los dos presenta mejores resultados. | es_ES |
dc.description.abstract | Social Networks have become increasingly important over the last few years. One of the
most relevant Social Network is Twitter. This Network allows users to share public comments
and multimedia contents. Social networks contain large amounts of hidden information. This
work aims to extract relevant data from Twitter and analyze and sort it in order to be able to
provide relevant information to users. This projects wants to evolve a model based on metatopics
in order to improve the accuracy. The previous model used LSA techniques and DBpedia
queries to obtain information who can be used to detect a meta-topic. Here, we improve the
old model incrementing the weight of DBpedia values. Those values allow us to know whether
a keyword belongs to a particular topic. We can not nd all the keywords in the dictionaries.
Hence, this work presents a new model where we calculate the distance between keywords via
NGD (Normalized Google Distance) and, later, we apply clustering techniques to discriminate
relevant groups. With this groups, we link the values via DBpedia with the rest of the keywords.
Finally, we compare both, the results from the old and the new model, to show who presents
the best results. | en_US |
dc.format.extent | 52 pág. | es_ES |
dc.format.mimetype | application/pdf | en_US |
dc.language.iso | spa | en_US |
dc.rights | web se | es_ES |
dc.rights.uri | https://creativecommons.org/licenses/by-nc-nd/4.0/ | |
dc.subject.other | Twitter | es_ES |
dc.subject.other | Web semántica | es_ES |
dc.title | Utilización de técnicas de clustering para mejorar la detección de meta-topics en conjuntos de datos extraidos de Twitter | es_ES |
dc.type | masterThesis | en_US |
dc.subject.eciencia | Informática | es_ES |
dc.rights.cc | Reconocimiento – NoComercial – SinObraDerivada | es_ES |
dc.rights.accessRights | openAccess | en_US |
dc.facultadUAM | Escuela Politécnica Superior | |