Utilización de técnicas de clustering para mejorar la detección de meta-topics en conjuntos de datos extraidos de Twitter

Delgado Calle, Carlos

UAM_Biblioteca

dc.contributor.advisor	Menéndez, Héctor D.
dc.contributor.author	Delgado Calle, Carlos
dc.contributor.other	UAM. Departamento de Ingeniería Informática	es_ES
dc.date.accessioned	2016-01-20T13:22:09Z
dc.date.available	2016-01-20T13:22:09Z
dc.date.issued	2015-09
dc.identifier.uri	http://hdl.handle.net/10486/669359
dc.description	Máster en Ingeniería Informática	es_ES
dc.description.abstract	En los últimos años, las redes sociales no han dejado de cobrar importancia. En especial destaca Twitter, donde distintos usuarios comparten opiniones, noticias y todo tipo de contenido multimedia. El conjunto de datos generado en las redes sociales contiene una gran cantidad de información oculta a simple vista. Uno de los principales intereses de este trabajo es ordenar dicha información de cara a poder facilitársela a los usuarios. Para ello, este trabajo pretende evolucionar un modelo basado en meta-t opics, de tal forma que consiga una agrupación más precisa que la actual. El anterior modelo hacía uso del análisis semántico para detectar un único meta-topic a través de técnicas como LSA unidas a consultas semánticas a DBpedia, para obtener resultados con los que poder analizar la validez del modelo. En este trabajo se pretende mejorar dicho modelo dando un mayor peso a los valores obtenidos de DBpedia; dichos valores permiten saber, de forma certera, si un término se relaciona con el meta-topic deseado, pero en el diccionario no pueden encontrarse todos los términos; Por ello en este trabajo se presenta un modelo basado en el uso de la métrica NGD (Normalized Google Distance), que calcula las distancias entre términos para posteriormente generar, utilizando técnicas de clustering, grupos de términos sobre los que poder propagar los valores de similitud obtenidos en DBpedia. Finalmente, se expondrán los resultados obtenidos con los dos modelos (el original y su evaluación) para comparar cual de los dos presenta mejores resultados.	es_ES
dc.description.abstract	Social Networks have become increasingly important over the last few years. One of the most relevant Social Network is Twitter. This Network allows users to share public comments and multimedia contents. Social networks contain large amounts of hidden information. This work aims to extract relevant data from Twitter and analyze and sort it in order to be able to provide relevant information to users. This projects wants to evolve a model based on metatopics in order to improve the accuracy. The previous model used LSA techniques and DBpedia queries to obtain information who can be used to detect a meta-topic. Here, we improve the old model incrementing the weight of DBpedia values. Those values allow us to know whether a keyword belongs to a particular topic. We can not nd all the keywords in the dictionaries. Hence, this work presents a new model where we calculate the distance between keywords via NGD (Normalized Google Distance) and, later, we apply clustering techniques to discriminate relevant groups. With this groups, we link the values via DBpedia with the rest of the keywords. Finally, we compare both, the results from the old and the new model, to show who presents the best results.	en_US
dc.format.extent	52 pág.	es_ES
dc.format.mimetype	application/pdf	en_US
dc.language.iso	spa	en_US
dc.rights	web se	es_ES
dc.rights.uri	https://creativecommons.org/licenses/by-nc-nd/4.0/
dc.subject.other	Twitter	es_ES
dc.subject.other	Web semántica	es_ES
dc.title	Utilización de técnicas de clustering para mejorar la detección de meta-topics en conjuntos de datos extraidos de Twitter	es_ES
dc.type	masterThesis	en_US
dc.subject.eciencia	Informática	es_ES
dc.rights.cc	Reconocimiento – NoComercial – SinObraDerivada	es_ES
dc.rights.accessRights	openAccess	en_US
dc.facultadUAM	Escuela Politécnica Superior

Files in this item

Name:: Delgado_Calle_Carlos_tfm.pdf
Size:: 719.0Kb
Format:: PDF

This item appears in the following Collection(s)

Trabajos de estudiantes (tesis doctorales, TFMs, TFGs, etc.) [20002]

Show simple item record

Except where otherwise noted, this item's license is described as web se

UAM_Biblioteca

Utilización de técnicas de clustering para mejorar la detección de meta-topics en conjuntos de datos extraidos de Twitter

Files in this item

This item appears in the following Collection(s)

Related items

Modelo de identificación de Meta-Topics a través de análisis semántico de conjuntos de datos extraídos de twitter ﻿

Utilización del análisis conjunto en la evaluación de las preferencias de incentivos a la innovación en las empresas manufactureras y de servicios de la República Dominicana ﻿

Métodos de clustering para conjuntos de clasificación ﻿

Modelo de identificación de Meta-Topics a través de análisis semántico de conjuntos de datos extraídos de twitter

Utilización del análisis conjunto en la evaluación de las preferencias de incentivos a la innovación en las empresas manufactureras y de servicios de la República Dominicana

Métodos de clustering para conjuntos de clasificación