Desarrollo de una web de análisis de datos NGS para la detección de mosaicismo genético en enfermedades raras y experimentos de edición genómica (CRISPR-CAS9)

Fernández Peñalver, Sergio

UAM_Biblioteca

dc.contributor.advisor	Moreno Pelayo, Miguel Ángel	es_ES
dc.contributor.advisor	Fernández Lanza, Val	es_ES
dc.contributor.advisor	Peso Ovalle, Luis	es_ES
dc.contributor.author	Fernández Peñalver, Sergio	es_ES
dc.contributor.other	UAM. Departamento de Ingeniería Informática	es_ES
dc.date.accessioned	2019-04-01T17:29:44Z
dc.date.available	2019-04-01T17:29:44Z
dc.date.issued	2019-02
dc.identifier.uri	http://hdl.handle.net/10486/687175	en_US
dc.description	Trabajo de fin de máster en Bioinformática y Biología Computacional	es_ES
dc.description.abstract	Este proyecto responde a la creciente necesidad de analizar y visualizar datos de secuenciación de nueva generación (NGS) producidos a través de experimentos de edición genética. Particularmente para aquellos utilizando tecnología de CRISPR-CAS9 [1]. Actualmente existen múltiples herramientas online que llevan a cabo cierto nivel de análisis de estos datos [2, 3], sin embargo proporcionan información aglutinada en forma de gráficos de in-dels (inserciones y deleciones) o gráficos de tarta sobresimplificados. No proporcionan una caracterización específica de los efectos de mosaicismo que pueden surgir a raíz de este tipo de experimentos de edición, efectos que pueden resultar determinantes para concluir que un experimento se ha llevado a cabo con éxito o no [4, 5, 6, 7, 8, 9]. Por ello el objetivo de esta aplicación es el de analizar y visualizar estos datos de secuenciación masiva de una manera sencilla y comprensible incluso para aquellos sin gran conocimiento bioinformático. Para llevar a cabo el proyecto se hizo uso del popular entorno de R [10] en un sistema operativo Linux. R tiene disponible una potente herramienta de desarrollo de páginas web, ShinyR [11]. Mediante su uso uno puede combinar las increíbles capacidades de procesado de datos de R con el desarrollo de una interfaz intuitiva y adaptable. El desarrollo se subdividió en dos fases principales: el análisis y el agrupamiento de los datos; y el procesado y visualización de estos. El análisis de los datos no es distinto de el procesado llevado a cabo para la identificación de variantes [12]. Comprobaciones de calidad, trimming de los adaptadores y primers, filtrado por calidad y tamaño y joining de secuencias en caso de estar trabajando con datos en paired-end [13]. Tras este procesamiento comienza el agrupamiento de los datos. En un proceso de identificación de variantes ahora precederíamos con un mapeo y usaríamos un llamador de variantes [14], sin embargo en este caso simplemente comparamos cada una de las secuencias entre ellas y las agrupamos según su similitud. Por cada grupo se determina una secuencia representativa o consenso y esta se la alinea frente a una secuencia de referencia. Donde la secuencia de referencia es la secuencia mayoritaria de la muestra sin editar. De esta manera si parte de las secuencias han sido mutadas mediante CRISPR-CAS9 , el alineamiento las identificaría al detectar in-dels (inserciones-deleciones) o cambios de base con respecto a la secuencia representativa. Ya que también somos capaces de asignar a cada grupo de secuencias un valor de Abundancia podemos determinar qué porcentaje de las secuencias han sido correctamente editadas frente a las que no. El proceso por el que CRISPR-CAS9 introduce mutaciones discretas es también susceptible de producir mutaciones aleatorias en posiciones aleatorias [15]. Estas mutaciones aleatorias pueden ser más o menos abundantes, y pueden tener un efecto patogénico o no, motivo por el cual su visualización a nivel de secuencia es necesaria. La aplicación proporciona muchas opciones a la hora de visualizar los resultados provenientes del análisis. Si el usuario proporciona un secuencia Target la aplicación llevará a cabo una búsqueda a través de todos los grupos buscandola e indicará al usuario qué grupo es el más parecido a ella. También facilita el análisis de las secuencias mediante BLASTn [16], la descarga de archivos de alineamiento y los archivos FASTA de todas o algunas de las secuencias representativas,múltiples gráficos e informe customizable que permite al usuario seleccionar la información que él o ella estime relevante.	es_ES
dc.format.extent	62 pág.	es_ES
dc.format.mimetype	application/pdf	en_US
dc.language.iso	spa	en_US
dc.rights.uri	https://creativecommons.org/licenses/by-nc-nd/4.0/
dc.subject.other	Secuenciación de nueva generación	es_ES
dc.subject.other	CRISPR-CAS9	es_ES
dc.subject.other	Mosaicismo genético	es_ES
dc.title	Desarrollo de una web de análisis de datos NGS para la detección de mosaicismo genético en enfermedades raras y experimentos de edición genómica (CRISPR-CAS9)	es_ES
dc.type	masterThesis	en_US
dc.subject.eciencia	Biología y Biomedicina / Biología	es_ES
dc.subject.eciencia	Informática	es_ES
dc.rights.cc	Reconocimiento – NoComercial – SinObraDerivada	es_ES
dc.rights.accessRights	openAccess	en_US
dc.facultadUAM	Escuela Politécnica Superior

Files in this item

Name:: fernández_ peñalver_sergio_tfm.pdf
Size:: 1.771Mb
Format:: PDF

This item appears in the following Collection(s)

Trabajos de estudiantes (tesis doctorales, TFMs, TFGs, etc.) [20060]

Show simple item record

Except where otherwise noted, this item's license is described as https://creativecommons.org/licenses/by-nc-nd/4.0/

UAM_Biblioteca

Desarrollo de una web de análisis de datos NGS para la detección de mosaicismo genético en enfermedades raras y experimentos de edición genómica (CRISPR-CAS9)

Files in this item

This item appears in the following Collection(s)

Related items

Using CRISPR/Cas9 based genetic screen to understand the role of Flk1 in the specification of endothelial and blood lineages ﻿

Identification of novel therapeutic targets in lung squamous cell carcinoma by CRISPR/Cas9 ﻿

CRISPR/Cas9 system and fluorescence enhanced BA-LIFT bioprinting technique as a toolbox for the study of the Immune System ﻿

Using CRISPR/Cas9 based genetic screen to understand the role of Flk1 in the specification of endothelial and blood lineages

Identification of novel therapeutic targets in lung squamous cell carcinoma by CRISPR/Cas9

CRISPR/Cas9 system and fluorescence enhanced BA-LIFT bioprinting technique as a toolbox for the study of the Immune System