dc.contributor.advisor | Moreno Pelayo, Miguel Ángel | es_ES |
dc.contributor.advisor | Fernández Lanza, Val | es_ES |
dc.contributor.advisor | Peso Ovalle, Luis | es_ES |
dc.contributor.author | Fernández Peñalver, Sergio | es_ES |
dc.contributor.other | UAM. Departamento de Ingeniería Informática | es_ES |
dc.date.accessioned | 2019-04-01T17:29:44Z | |
dc.date.available | 2019-04-01T17:29:44Z | |
dc.date.issued | 2019-02 | |
dc.identifier.uri | http://hdl.handle.net/10486/687175 | en_US |
dc.description | Trabajo de fin de máster en Bioinformática y Biología Computacional | es_ES |
dc.description.abstract | Este proyecto responde a la creciente necesidad de analizar y visualizar datos de secuenciación
de nueva generación (NGS) producidos a través de experimentos de edición genética.
Particularmente para aquellos utilizando tecnología de CRISPR-CAS9 [1]. Actualmente existen
múltiples herramientas online que llevan a cabo cierto nivel de análisis de estos datos [2, 3],
sin embargo proporcionan información aglutinada en forma de gráficos de in-dels (inserciones y
deleciones) o gráficos de tarta sobresimplificados. No proporcionan una caracterización específica
de los efectos de mosaicismo que pueden surgir a raíz de este tipo de experimentos de edición,
efectos que pueden resultar determinantes para concluir que un experimento se ha llevado a cabo
con éxito o no [4, 5, 6, 7, 8, 9]. Por ello el objetivo de esta aplicación es el de analizar y visualizar
estos datos de secuenciación masiva de una manera sencilla y comprensible incluso para aquellos
sin gran conocimiento bioinformático.
Para llevar a cabo el proyecto se hizo uso del popular entorno de R [10] en un sistema
operativo Linux. R tiene disponible una potente herramienta de desarrollo de páginas web,
ShinyR [11]. Mediante su uso uno puede combinar las increíbles capacidades de procesado de
datos de R con el desarrollo de una interfaz intuitiva y adaptable.
El desarrollo se subdividió en dos fases principales: el análisis y el agrupamiento de los datos;
y el procesado y visualización de estos. El análisis de los datos no es distinto de el procesado
llevado a cabo para la identificación de variantes [12]. Comprobaciones de calidad, trimming de
los adaptadores y primers, filtrado por calidad y tamaño y joining de secuencias en caso de estar
trabajando con datos en paired-end [13]. Tras este procesamiento comienza el agrupamiento de
los datos. En un proceso de identificación de variantes ahora precederíamos con un mapeo y
usaríamos un llamador de variantes [14], sin embargo en este caso simplemente comparamos
cada una de las secuencias entre ellas y las agrupamos según su similitud. Por cada grupo se
determina una secuencia representativa o consenso y esta se la alinea frente a una secuencia
de referencia. Donde la secuencia de referencia es la secuencia mayoritaria de la muestra sin
editar. De esta manera si parte de las secuencias han sido mutadas mediante CRISPR-CAS9 , el
alineamiento las identificaría al detectar in-dels (inserciones-deleciones) o cambios de base con
respecto a la secuencia representativa. Ya que también somos capaces de asignar a cada grupo
de secuencias un valor de Abundancia podemos determinar qué porcentaje de las secuencias han
sido correctamente editadas frente a las que no.
El proceso por el que CRISPR-CAS9 introduce mutaciones discretas es también susceptible
de producir mutaciones aleatorias en posiciones aleatorias [15]. Estas mutaciones aleatorias pueden
ser más o menos abundantes, y pueden tener un efecto patogénico o no, motivo por el cual su visualización a nivel de secuencia es necesaria.
La aplicación proporciona muchas opciones a la hora de visualizar los resultados provenientes del análisis. Si el usuario proporciona un secuencia Target la aplicación llevará a cabo una búsqueda a través de todos los grupos buscandola e indicará al usuario qué grupo es el más parecido a ella. También facilita el análisis de las secuencias mediante BLASTn [16], la descarga de archivos de alineamiento y los archivos FASTA de todas o algunas de las secuencias representativas,múltiples gráficos e informe customizable que permite al usuario seleccionar la información que él o ella estime relevante. | es_ES |
dc.format.extent | 62 pág. | es_ES |
dc.format.mimetype | application/pdf | en_US |
dc.language.iso | spa | en_US |
dc.rights.uri | https://creativecommons.org/licenses/by-nc-nd/4.0/ | |
dc.subject.other | Secuenciación de nueva generación | es_ES |
dc.subject.other | CRISPR-CAS9 | es_ES |
dc.subject.other | Mosaicismo genético | es_ES |
dc.title | Desarrollo de una web de análisis de datos NGS para la detección de mosaicismo genético en enfermedades raras y experimentos de edición genómica (CRISPR-CAS9) | es_ES |
dc.type | masterThesis | en_US |
dc.subject.eciencia | Biología y Biomedicina / Biología | es_ES |
dc.subject.eciencia | Informática | es_ES |
dc.rights.cc | Reconocimiento – NoComercial – SinObraDerivada | es_ES |
dc.rights.accessRights | openAccess | en_US |
dc.facultadUAM | Escuela Politécnica Superior | |