Abstract:
Con la ingente cantidad de información que se genera diariamente y a la cual tenemos acceso
gracias a Internet, la sumarización de textos ha resultado ser una herramienta increíblemente útil, no
solo como un medio para ganar eficiencia en su lectura sino también para despojar estos textos de la
información irrelevante o secundaria que puedan contener.
Si bien algunos textos traen consigo algún tipo de resumen o abstracto, como pueda tener por
ejemplo este trabajo, los artículos periodísticos no, es por eso que en este trabajo se estudian distintas
técnicas de analítica de texto para sumarizar noticias en español. El trabajo se desarrolla en Python y
tiene como finalidad la obtención de resúmenes extractivos y la generación de los títulos de noticias
extraídas de publicaciones nacionales.
Tras el estudio del estado actual del estado del arte, decidimos implementar dos técnicas de sumarización
extractiva para poder comparar sus resultados y construir un modelo sequence-to-sequence
que permita la generación de los titulares de las noticias.
Los resultados obtenidos demuestran la capacidad para llevar a cabo la tarea así como revelan
algunos problemas, como son el hacer uso de frases que hacen referencia a información anterior que
no han sido seleccionadas o la complicación del resumen de entrevistas.
Palabras