Procesamiento de texto manuscrito I Segmentación a nivel de palabras, indexación y clustering

Romera Vicente, Nerea

UAM_Biblioteca

dc.contributor.advisor	Colás Pasamontes, José
dc.contributor.author	Romera Vicente, Nerea
dc.contributor.other	UAM. Departamento de Tecnología Electrónica y de las Comunicaciones	es_ES
dc.date.accessioned	2017-08-08T13:38:10Z
dc.date.available	2017-08-08T13:38:10Z
dc.date.issued	2017-07
dc.identifier.uri	http://hdl.handle.net/10486/679289
dc.description.abstract	Este Trabajo de Fin de Grado tiene como objetivo proponer una solución que permita la segmentación e indexación de palabras extraídas de textos manuscritos. La motivación de este proyecto surge dada la escasa investigación que existe sobre el tema. En la actualidad, el único proceso de digitalización que se ha llevado a cabo con algunos textos manuscritos es escaneado/fotografía de los mismos con ayuda de escáneres occipitales que respetan las condiciones naturales de los libros. Este proceso de digitalización se realizó con la premisa de poner a disposición de expertos en la materia todo el contenido histórico para facilitar su análisis. No obstante, a pesar del cambio de soporte, el proceso sigue siendo totalmente manual. Por tanto, se considera este proyecto como una oportunidad para poner la tecnología a disposición de la historia, creando una herramienta que tenga la capacidad de mejorar las características de las imágenes, a través de una fase de pre-procesamiento, para posteriormente efectuar una segmentación de los textos en líneas y palabras. Los resultados de la segmentación se guardaran en una base de datos que contendrá un archivo de imagen, así como una referencia a la ubicación de las palabras (acta de la que provienen, línea en la que se sitúa, y posición en la línea). Con esto, se espera que en trabajos posteriores se alimente la herramienta de un algoritmo dinámico de agrupamiento para que el tiempo de trabajo de paleógrafos e historiadores disminuya notablemente.	es_ES
dc.description.abstract	This End-of-Grade Paper aims to propose a solution that allows the segmentation and indexing of words extracted from handwritten texts. The motivation of this project arises from the scarce research that exists on the subject. At present, the only process of digitization that has been carried out with some handwritten texts is scanned / photographed with the help of occipital scanners that respect the natural conditions of the books. This digitization process was carried out with the premise of making available to experts in the field all the historical content to facilitate their analysis. However, despite the change of support, the process remains entirely manual. Therefore, this project is considered as an opportunity to make the technology available to History, creating a tool that has the ability to improve the characteristics of the images, through a pre-processing phase, to later carry out a segmentation of the texts in lines and words. The results of the segmentation will be saved in a database containing an image file, as well as a reference to the location of the words (record from which they come, line in which it is situated, and position in the line). With this, it is expected that in later works the tool of a dynamic grouping algorithm will be fed so that the working time of paleographers and historians will decrease significantly	en
dc.format.extent	50 pág.	es_ES
dc.format.mimetype	application/pdf	en
dc.language.iso	spa	en
dc.rights.uri	https://creativecommons.org/licenses/by-nc-nd/4.0/
dc.subject.other	Binarización	es_ES
dc.subject.other	Bounding Box	en
dc.subject.other	CCL	es_ES
dc.title	Procesamiento de texto manuscrito I Segmentación a nivel de palabras, indexación y clustering	es_ES
dc.type	bachelorThesis	en
dc.subject.eciencia	Telecomunicaciones	es_ES
dc.rights.cc	Reconocimiento – NoComercial – SinObraDerivada	es_ES
dc.rights.accessRights	openAccess	en
dc.facultadUAM	Escuela Politécnica Superior

Files in this item

Name:: Romera_Vicente_Nerea_tfg.pdf
Size:: 2.412Mb
Format:: PDF

This item appears in the following Collection(s)

Trabajos de estudiantes (tesis doctorales, TFMs, TFGs, etc.) [20060]

Show simple item record

Except where otherwise noted, this item's license is described as https://creativecommons.org/licenses/by-nc-nd/4.0/

UAM_Biblioteca

Procesamiento de texto manuscrito I Segmentación a nivel de palabras, indexación y clustering

Files in this item

This item appears in the following Collection(s)

Related items

Procesamiento de textos manuscritos: Técnicas de agrupamiento de imágenes de palabras ﻿

Texto impreso y texto manuscrito en la poesía de Quevedo ﻿

La segmentación de imágenes: El método de los contornos activos ﻿

Procesamiento de textos manuscritos: Técnicas de agrupamiento de imágenes de palabras

Texto impreso y texto manuscrito en la poesía de Quevedo

La segmentación de imágenes: El método de los contornos activos