Nowadays, the storage and processing capacities of current computer systems allow
the use of diverse and massive data sources to extract knowledge that can guide managerial
decision-making processes. Nevertheless, data analysis methods face some issues
related to the characteristics of current data sources. In this work, we will focus in two
aspects of current challenges in this area. On the one hand, we will propose some alternatives
to transform heterogeneous data to a format that eases the exploration and study
to network managers. On the other hand, we will look to the improvement of the scalability,
extensibility and results obtained by using such solutions. Given that network monitoring
is a critical labor, as a result of current systems’ dependency on communication infrastructures,
this Master Thesis provides a study of the applicability of Functional Data Analysis
(FDA) to Network Traffic Monitoring and Analysis (NTMA) and network management. FDA
is a branch of statistics that study infinite dimensional random variables, extending statistical
properties to functional spaces. As several sources of network management data
can be interpreted as functional data, our hypothesis is that the functional perspective
may produce several advantages during the study and knowledge-acquisition phases of
network analysis processes. This fact points to the improvement of several tools and methods
that are used by managers and that can result insufficient with the current advances
in network infrastructures. With this objective in mind, we present several proposals and
some empirical results to illustrate the advantages of FDA when applied to network data
mining.
Actualmente, las capacidades de almacenamiento y de cómputo de los sistemas
informáticos permiten el empleo de fuentes diversas y masivas de datos para extraer
conocimiento de interés para la toma de decisiones de gestión. Esta situación plantea
retos en el área del análisis de datos orientados a, por un lado, transformar los datos
obtenidos de diversas fuentes a un formato que permita su exploración y estudio; y por
otro lado, garantizar la escalabilidad de las soluciones, y su extensión y mejora continua.
Dado que desde el punto de vista técnico, el control y evaluación de las prestaciones
de las redes de ordenadores es un punto crítico por la dependencia que tienen
los sistemas informáticos actuales en las infraestructuras de comunicaciones, en este
Trabajo Fin de Máster se plantea el estudio de la aplicación de las técnicas de análisis
estadístico de datos funcionales (Functional Data Analysis, FDA) al área de gestión de
red. Estas técnicas consideran variables aleatorias de dimensión infinita, de modo que
estudian propiedades estadísticas en espacios funcionales. Dado que muchos de los
datos que son tenidos en cuenta durante las tareas involucradas en la gestión de red se
acomodan a esta interpretación, se plantea como hipótesis que FDA puede proporciona
ciertos avances en el estudio y extracción de conclusiones para guiar las decisiones de
los agentes de gestión de red. Con el fin de estructurar este estudio, se presentará un
catálogo de propuestas, presentando los resultados de su aplicación a la minería de datos
de red.