Show simple item record

dc.contributor.advisorMenéndez, Héctor D.
dc.contributor.authorDelgado Calle, Carlos
dc.contributor.otherUAM. Departamento de Ingeniería Informáticaes_ES
dc.date.accessioned2016-01-20T13:22:09Z
dc.date.available2016-01-20T13:22:09Z
dc.date.issued2015-09
dc.identifier.urihttp://hdl.handle.net/10486/669359
dc.descriptionMáster en Ingeniería Informáticaes_ES
dc.description.abstractEn los últimos años, las redes sociales no han dejado de cobrar importancia. En especial destaca Twitter, donde distintos usuarios comparten opiniones, noticias y todo tipo de contenido multimedia. El conjunto de datos generado en las redes sociales contiene una gran cantidad de información oculta a simple vista. Uno de los principales intereses de este trabajo es ordenar dicha información de cara a poder facilitársela a los usuarios. Para ello, este trabajo pretende evolucionar un modelo basado en meta-t opics, de tal forma que consiga una agrupación más precisa que la actual. El anterior modelo hacía uso del análisis semántico para detectar un único meta-topic a través de técnicas como LSA unidas a consultas semánticas a DBpedia, para obtener resultados con los que poder analizar la validez del modelo. En este trabajo se pretende mejorar dicho modelo dando un mayor peso a los valores obtenidos de DBpedia; dichos valores permiten saber, de forma certera, si un término se relaciona con el meta-topic deseado, pero en el diccionario no pueden encontrarse todos los términos; Por ello en este trabajo se presenta un modelo basado en el uso de la métrica NGD (Normalized Google Distance), que calcula las distancias entre términos para posteriormente generar, utilizando técnicas de clustering, grupos de términos sobre los que poder propagar los valores de similitud obtenidos en DBpedia. Finalmente, se expondrán los resultados obtenidos con los dos modelos (el original y su evaluación) para comparar cual de los dos presenta mejores resultados.es_ES
dc.description.abstractSocial Networks have become increasingly important over the last few years. One of the most relevant Social Network is Twitter. This Network allows users to share public comments and multimedia contents. Social networks contain large amounts of hidden information. This work aims to extract relevant data from Twitter and analyze and sort it in order to be able to provide relevant information to users. This projects wants to evolve a model based on metatopics in order to improve the accuracy. The previous model used LSA techniques and DBpedia queries to obtain information who can be used to detect a meta-topic. Here, we improve the old model incrementing the weight of DBpedia values. Those values allow us to know whether a keyword belongs to a particular topic. We can not nd all the keywords in the dictionaries. Hence, this work presents a new model where we calculate the distance between keywords via NGD (Normalized Google Distance) and, later, we apply clustering techniques to discriminate relevant groups. With this groups, we link the values via DBpedia with the rest of the keywords. Finally, we compare both, the results from the old and the new model, to show who presents the best results.en_US
dc.format.extent52 pág.es_ES
dc.format.mimetypeapplication/pdfen_US
dc.language.isospaen_US
dc.rightsweb sees_ES
dc.rights.urihttps://creativecommons.org/licenses/by-nc-nd/4.0/
dc.subject.otherTwitteres_ES
dc.subject.otherWeb semánticaes_ES
dc.titleUtilización de técnicas de clustering para mejorar la detección de meta-topics en conjuntos de datos extraidos de Twitteres_ES
dc.typemasterThesisen_US
dc.subject.ecienciaInformáticaes_ES
dc.rights.ccReconocimiento – NoComercial – SinObraDerivadaes_ES
dc.rights.accessRightsopenAccessen_US
dc.facultadUAMEscuela Politécnica Superior


Files in this item

Thumbnail

This item appears in the following Collection(s)

Show simple item record

web se
Except where otherwise noted, this item's license is described as web se