Show simple item record

dc.contributor.advisorColás Pasamontes, José 
dc.contributor.authorRomera Vicente, Nerea
dc.contributor.otherUAM. Departamento de Tecnología Electrónica y de las Comunicacioneses_ES
dc.date.accessioned2017-08-08T13:38:10Z
dc.date.available2017-08-08T13:38:10Z
dc.date.issued2017-07
dc.identifier.urihttp://hdl.handle.net/10486/679289
dc.description.abstractEste Trabajo de Fin de Grado tiene como objetivo proponer una solución que permita la segmentación e indexación de palabras extraídas de textos manuscritos. La motivación de este proyecto surge dada la escasa investigación que existe sobre el tema. En la actualidad, el único proceso de digitalización que se ha llevado a cabo con algunos textos manuscritos es escaneado/fotografía de los mismos con ayuda de escáneres occipitales que respetan las condiciones naturales de los libros. Este proceso de digitalización se realizó con la premisa de poner a disposición de expertos en la materia todo el contenido histórico para facilitar su análisis. No obstante, a pesar del cambio de soporte, el proceso sigue siendo totalmente manual. Por tanto, se considera este proyecto como una oportunidad para poner la tecnología a disposición de la historia, creando una herramienta que tenga la capacidad de mejorar las características de las imágenes, a través de una fase de pre-procesamiento, para posteriormente efectuar una segmentación de los textos en líneas y palabras. Los resultados de la segmentación se guardaran en una base de datos que contendrá un archivo de imagen, así como una referencia a la ubicación de las palabras (acta de la que provienen, línea en la que se sitúa, y posición en la línea). Con esto, se espera que en trabajos posteriores se alimente la herramienta de un algoritmo dinámico de agrupamiento para que el tiempo de trabajo de paleógrafos e historiadores disminuya notablemente.es_ES
dc.description.abstractThis End-of-Grade Paper aims to propose a solution that allows the segmentation and indexing of words extracted from handwritten texts. The motivation of this project arises from the scarce research that exists on the subject. At present, the only process of digitization that has been carried out with some handwritten texts is scanned / photographed with the help of occipital scanners that respect the natural conditions of the books. This digitization process was carried out with the premise of making available to experts in the field all the historical content to facilitate their analysis. However, despite the change of support, the process remains entirely manual. Therefore, this project is considered as an opportunity to make the technology available to History, creating a tool that has the ability to improve the characteristics of the images, through a pre-processing phase, to later carry out a segmentation of the texts in lines and words. The results of the segmentation will be saved in a database containing an image file, as well as a reference to the location of the words (record from which they come, line in which it is situated, and position in the line). With this, it is expected that in later works the tool of a dynamic grouping algorithm will be fed so that the working time of paleographers and historians will decrease significantlyen
dc.format.extent50 pág.es_ES
dc.format.mimetypeapplication/pdfen
dc.language.isospaen
dc.rights.urihttps://creativecommons.org/licenses/by-nc-nd/4.0/
dc.subject.otherBinarizaciónes_ES
dc.subject.otherBounding Boxen
dc.subject.otherCCLes_ES
dc.titleProcesamiento de texto manuscrito I Segmentación a nivel de palabras, indexación y clusteringes_ES
dc.typebachelorThesisen
dc.subject.ecienciaTelecomunicacioneses_ES
dc.rights.ccReconocimiento – NoComercial – SinObraDerivadaes_ES
dc.rights.accessRightsopenAccessen
dc.facultadUAMEscuela Politécnica Superior


Files in this item

Thumbnail

This item appears in the following Collection(s)

Show simple item record

https://creativecommons.org/licenses/by-nc-nd/4.0/
Except where otherwise noted, this item's license is described as https://creativecommons.org/licenses/by-nc-nd/4.0/