dc.contributor.advisor | Colás Pasamontes, José | |
dc.contributor.author | Romera Vicente, Nerea | |
dc.contributor.other | UAM. Departamento de Tecnología Electrónica y de las Comunicaciones | es_ES |
dc.date.accessioned | 2017-08-08T13:38:10Z | |
dc.date.available | 2017-08-08T13:38:10Z | |
dc.date.issued | 2017-07 | |
dc.identifier.uri | http://hdl.handle.net/10486/679289 | |
dc.description.abstract | Este Trabajo de Fin de Grado tiene como objetivo proponer una solución que permita la segmentación e indexación de palabras extraídas de textos manuscritos. La motivación de este proyecto surge dada la escasa investigación que existe sobre el tema. En la actualidad, el único proceso de digitalización que se ha llevado a cabo con algunos textos manuscritos es escaneado/fotografía de los mismos con ayuda de escáneres occipitales que respetan las condiciones naturales de los libros. Este proceso de digitalización se realizó con la premisa de poner a disposición de expertos en la materia todo el contenido histórico para facilitar su análisis. No obstante, a pesar del cambio de soporte, el proceso sigue siendo totalmente manual. Por tanto, se considera este proyecto como una oportunidad para poner la tecnología a disposición de la historia, creando una herramienta que tenga la capacidad de mejorar las características de las imágenes, a través de una fase de pre-procesamiento, para posteriormente efectuar una segmentación de los textos en líneas y palabras. Los resultados de la segmentación se guardaran en una base de datos que contendrá un archivo de imagen, así como una referencia a la ubicación de las palabras (acta de la que provienen, línea en la que se sitúa, y posición en la línea). Con esto, se espera que en trabajos posteriores se alimente la herramienta de un algoritmo dinámico de agrupamiento para que el tiempo de trabajo de paleógrafos e historiadores disminuya notablemente. | es_ES |
dc.description.abstract | This End-of-Grade Paper aims to propose a solution that allows the segmentation and indexing of words extracted from handwritten texts. The motivation of this project arises from the scarce research that exists on the subject. At present, the only process of digitization that has been carried out with some handwritten texts is scanned / photographed with the help of occipital scanners that respect the natural conditions of the books. This digitization process was carried out with the premise of making available to experts in the field all the historical content to facilitate their analysis. However, despite the change of support, the process remains entirely manual. Therefore, this project is considered as an opportunity to make the technology available to History, creating a tool that has the ability to improve the characteristics of the images, through a pre-processing phase, to later carry out a segmentation of the texts in lines and words. The results of the segmentation will be saved in a database containing an image file, as well as a reference to the location of the words (record from which they come, line in which it is situated, and position in the line). With this, it is expected that in later works the tool of a dynamic grouping algorithm will be fed so that the working time of paleographers and historians will decrease significantly | en |
dc.format.extent | 50 pág. | es_ES |
dc.format.mimetype | application/pdf | en |
dc.language.iso | spa | en |
dc.rights.uri | https://creativecommons.org/licenses/by-nc-nd/4.0/ | |
dc.subject.other | Binarización | es_ES |
dc.subject.other | Bounding Box | en |
dc.subject.other | CCL | es_ES |
dc.title | Procesamiento de texto manuscrito I Segmentación a nivel de palabras, indexación y clustering | es_ES |
dc.type | bachelorThesis | en |
dc.subject.eciencia | Telecomunicaciones | es_ES |
dc.rights.cc | Reconocimiento – NoComercial – SinObraDerivada | es_ES |
dc.rights.accessRights | openAccess | en |
dc.facultadUAM | Escuela Politécnica Superior | |