dc.description.abstract | El acoso escolar es un problema cada vez más visible en las aulas de los colegios, y preocupa a expertos de todos los ámbitos. Las graves consecuencias que genera a las víctimas sugieren la necesidad de estudiarlo con el fin de evitar nuevos casos.
Además, el uso de las tecnologías y las redes sociales crece progresivamente en jóvenes y adolescentes. Esta nueva manera de comunicación ha propiciado la transición del acoso escolar únicamente a la práctica conjunta de acoso tradicional y el presente a través de los medios tecnológicos, el ciberbullying.
Este Trabajo Fin de Grado tiene como objetivo principal desarrollar un clasificador supervisado que sea capaz de decidir si un texto sería calificado como bullying o no por un experto en este ámbito. Para conseguir esta meta, se ha trabajado con un conjunto de documentos obtenidos de Twitter, que han sido marcados por un etiquetador. Después, se ha aplicado un proceso de limpieza y tratado de estos tuits, en el que se han eliminado emoticonos, nombres de usuarios y retuits. También se han agrupado conjuntos de términos con el mismo significado en otras expresiones, para hacer un estudio más genérico. Más tarde, se han aplicado procedimientos para convertir estos textos ya tratados a vectores numéricos, de forma que sirvan como argumentos de entrada para los clasificadores que se han probado.
Los clasificadores explorados han sido Naive Bayes, Random Forest, Support Vector Machines (SVM) y K Vecinos más cercanos. Todos ellos han sido sometidos a una búsqueda exhaustiva de sus hiper-parámetros con el fin de ajustar las mejores condiciones y así conseguir el mejor rendimiento.
A pesar de todas las limitaciones en la dificultad de encontrar información referida al acoso, tras llevar a cabo un proceso manual de etiquetado, tratar los datos utilizando técnicas de procesamiento del lenguaje natural y realizar una serie de pruebas, variantes y combinaciones de distintos algoritmos, los resultados muestran que el mejor clasificador en este caso es SVM con el método de Bag of Words (Bolsa de Palabras) para conversión a vectores, alcanzando una exhaustividad en la clasificación de más del 73%, y una precisión del casi 64%. | es_ES |