Construcción de modelos de clasificación automática para la detección del acoso
Author
Francisco Rus, Alejandra deAdvisor
Carro Salas, Rosa MaríaEntity
UAM. Departamento de Ingeniería InformáticaDate
2018-05Subjects
Acoso; agresores; aprendizaje automático; Informática; MatemáticasEsta obra está bajo una licencia de Creative Commons Reconocimiento-NoComercial-SinObraDerivada 4.0 Internacional.
Abstract
El acoso escolar es un problema cada vez más visible en las aulas de los colegios, y preocupa a expertos de todos los ámbitos. Las graves consecuencias que genera a las víctimas sugieren la necesidad de estudiarlo con el fin de evitar nuevos casos.
Además, el uso de las tecnologías y las redes sociales crece progresivamente en jóvenes y adolescentes. Esta nueva manera de comunicación ha propiciado la transición del acoso escolar únicamente a la práctica conjunta de acoso tradicional y el presente a través de los medios tecnológicos, el ciberbullying.
Este Trabajo Fin de Grado tiene como objetivo principal desarrollar un clasificador supervisado que sea capaz de decidir si un texto sería calificado como bullying o no por un experto en este ámbito. Para conseguir esta meta, se ha trabajado con un conjunto de documentos obtenidos de Twitter, que han sido marcados por un etiquetador. Después, se ha aplicado un proceso de limpieza y tratado de estos tuits, en el que se han eliminado emoticonos, nombres de usuarios y retuits. También se han agrupado conjuntos de términos con el mismo significado en otras expresiones, para hacer un estudio más genérico. Más tarde, se han aplicado procedimientos para convertir estos textos ya tratados a vectores numéricos, de forma que sirvan como argumentos de entrada para los clasificadores que se han probado.
Los clasificadores explorados han sido Naive Bayes, Random Forest, Support Vector Machines (SVM) y K Vecinos más cercanos. Todos ellos han sido sometidos a una búsqueda exhaustiva de sus hiper-parámetros con el fin de ajustar las mejores condiciones y así conseguir el mejor rendimiento.
A pesar de todas las limitaciones en la dificultad de encontrar información referida al acoso, tras llevar a cabo un proceso manual de etiquetado, tratar los datos utilizando técnicas de procesamiento del lenguaje natural y realizar una serie de pruebas, variantes y combinaciones de distintos algoritmos, los resultados muestran que el mejor clasificador en este caso es SVM con el método de Bag of Words (Bolsa de Palabras) para conversión a vectores, alcanzando una exhaustividad en la clasificación de más del 73%, y una precisión del casi 64%.
Files in this item
Google Scholar:Francisco Rus, Alejandra de
This item appears in the following Collection(s)
Except where otherwise noted, this item's license is described as https://creativecommons.org/licenses/by-nc-nd/4.0/
Related items
Showing items related by title, author, creator and subject.
-
Construcción de modelos de clasificación automática para discursos de odio
Pereira Kohatsu, Juan Carlos
2017-06 -
Mejora en la generación automática de modelos metabólicos (GEM) de organismos relevantes en la industria alimentaria mediante gap filling
Muñoz López, Francisco Manuel
2021-06 -
Aplicación android para prevención de acoso escolar
González Aranguren, María Alejandra
2020-07