Análisis de los datos de los papeles de Panamá usando métodos de I.A
Author
Mateos Robles, MiguelAdvisor
Domínguez Carreta, David Renato
Entity
UAM. Departamento de Ingeniería InformáticaDate
2017-06Subjects
Papeles de Panamá; Sociedades offshore; Paraísos fiscales; Informática
Esta obra está bajo una licencia de Creative Commons Reconocimiento-NoComercial-SinObraDerivada 4.0 Internacional.
Abstract
Los papeles de Panamá se tratan de la mayor filtración de documentos de la historia. Estos documentos se encontraban en el despacho de abogados de Mossack Fonseca cuya principal función era de hacer de intermediario para la creación de sociedades offshore. Los documentos desvelan como miles de personas ocultan su patrimonio en este tipo de sociedades, situadas en paraísos fiscales. Los documentos filtrados tienen un tamaño de 2,6 terabytes y contienen información sobre 214.488 entidades offshore que conecta a un total de 208 territorios diferentes.
Este Trabajo Fin de Grado consiste en la recopilación de datos de los Papeles de Panamá, para ello se ha usado la base de datos de Offshore Leaks. Esta base de datos ha sido analizada y reestructurada, para facilitar la lectura de datos con el objetivo de construir una red de conexiones de países basada en las relaciones entre diferentes territorios que aparecen en estos papeles. También se ha buscado el patrón de emisión que utiliza cada país. Este patrón ha sido comparado entre los países aplicando el coeficiente de correlación de Spearman. El propósito de esta comparación era identificar si siguen un patrón similar los paraísos fiscales y países vecinos.
También se ha analizado el comportamiento de las apariciones de los países en los papeles. Este comportamiento se puede dividir en dos funciones distintas, ajuste potencial si tienen pocas apariciones y exponencial en caso contrario. Posteriormente se ha querido comprobar si existe correlación entre las apariciones con datos como población, superficie y PIB.
Por último, se ha calculado la distancia existente entre los países aplicando el algoritmo de Dijkstra, el cual, mide la distancia mínima entre dos nodos de una red.
Se ha utilizado de ejemplo a España y los países con mayor número de apariciones en los papeles a la hora de comparar y analizar datos. The Panama papers deal with the largest leak of documents in the history. These documents were in the Panamanian law firm Mossack Fonseca whose main function was to act as intermediary to create offshore societies. The documents reveal how thousands of people hid their assets in companies located in tax haven. The 2,6 terabyte sized leaked documents containing information of 214,488 offshore entities which connect 208 different territories.
Panama papers which have been provided with the database of Offshore Leak. The database has been analyzed and used to do new tables and to make easier to read data. The main objective of the project has been creating a connection networks of the countries involved based on the relations between different territories that appear in these papers. We also have researched the emission pattern used in each country. These emission patterns, have been compared applying Spearman correlation coefficient. The purpose of this comparison was identifying a similar pattern between tax havens and neighboring countries
We have also analyzed the performance of countries appearances in the papers and it was possible to divide these performances into two different functions: potential fitting for the those with low appearances and exponential fitting otherwise. Afterwards, we wanted to check if there is a correlation between appearances and other data such as population, area and GDP.
Finally, we have applied the Dijkstra algorithm which calculates the minimum distance between two nodes, with the purpose of calculating which countries are closer according to the paper’s relations.
Spain and the countries with the largest number of appearances in the Panama papers have been used as an example for the comparison and analysis of the data.
Files in this item
Google Scholar:Mateos Robles, Miguel
This item appears in the following Collection(s)
Except where otherwise noted, this item's license is described as https://creativecommons.org/licenses/by-nc-nd/4.0/
Related items
Showing items related by title, author, creator and subject.
-
Estudio y aplicación de métodos supervisados para el análisis de patrones de expresión génica
Mateos Gil, Alvaro
2006-03-14