Desarrollo de una GUI para el análisis de datos de secuenciación genómica
Entity
UAM. Departamento de Ingeniería InformáticaDate
2016-01Subjects
Interfaces gráficas (Informática); Bioinformática; InformáticaEsta obra está bajo una licencia de Creative Commons Reconocimiento-NoComercial-SinObraDerivada 4.0 Internacional.
Abstract
RNA-seq es una tecnología perteneciente al grupo de secuenciaciones de nueva generación
(Next Generation Sequencing, NGS), que proporciona información sobre el ARN y, en particular,
sobre la expresión de genes presentes en dicho ARN. Se trata de una tecnología ampliamente
utilizada para realizar el análisis de la expresión diferencial de genes. Sin embargo, la principal
dificultad de este tipo de análisis reside en la falta de un workflow unificado, debido a la gran
cantidad de herramientas que existen y que su uso no es sencillo para los usuarios no expertos en
informática. El uso de estas herramientas a día de hoy se realiza mediante la línea de comandos
UNIX y es necesario conocer los formatos de de los ficheros que se utilizan en cada paso del
análisis RNA-seq.
El objetivo de este Trabajo de Fin de Grado es crear un workflow que integre algunas de las
herramientas empleadas en cada paso del análisis RNA-seq y permitir su utilización mediante
una Interfaz Gráfica de Usuario (GUI) que facilite realizar el análisis de expresión diferencial
de genes. Esto se ha conseguido en dos partes. Por una parte, se ha realizado un estudio exhaustivo
de las herramientas disponibles en el estado del arte para determinar cuales son las
más utilizadas por los usuario finales. Las herramientas seleccionadas son: Bowtie, Samtools,
HTSeq y DESeq. Además, se ha diseñado y desarrollado contador de expresión génica que trata
de paliar las deficiencias de algunas de las herramientas más populares. Por otra parte, se ha
desarrollado una aplicación web que permite realizar el análisis de expresión diferencial de varias
condiciones experimentales simultáneamente, integra todas las herramientas seleccionadas,
permite determinar las opciones de cada una de ellas y proporciona al usuario una visualización
gráfica de los resultados del análisis de expresión diferencial.
La Interfaz Gráfica de Usuario utiliza las librerías Shiny y Shinydashboard lo que mejora la
usabilidad y la experiencia de usuario en comparación a la utilización de las herramientas por
la línea de comandos o a través de herramientas de integración demasiado sofisticadas que no
llegan a ser útiles para el usuario no experto. La aplicación ha sido diseñada e implementada
de acuerdo al patrón de arquitectura Modelo-Vista-Controlador (MVC). La funcionalidad de
la vista y el controlador vienen proporcionados por la estructura que sigue la implementación
con Shiny y Shinydashboard. El modelo queda definido por las herramientas utilizadas para
el análisis y por el formato estándar de los ficheros generados durante el análisis de expresión
diferencial de genes.
Finalmente, los requisitos funcionales y no funcionales de la aplicación han sido validados y
verificados realizando pruebas con datos RNA-seq simulados y experimentos reales. RNA-seq is a Next-Generation Sequencing (NGS) technology that provides information
about RNA and in particular the gene expression present in a sample of RNA. It is a widespread
and useful method for the analysis of differential gene expression. However, the large number
of tools available and the lack of an unified workflow make the RNA data analysis very difficult
to non-experts.
The objective of this Masters Thesis is to create a work flow that integrates some of the
most popular tools used in each step of RNA-seq analysis and allow its use through a Graphical
User Interface (GUI) that facilitates the gene differential expression analysis. This is achieved
by completing two main tasks. First, conducting a study of the state-of-the-art RNA-seq tools
in order to determine which tools are the most used by the end user, learn how to use them.
Namely, the selected tools are: Bowtie, Samtools, HTSeq and DESeq. A tool for gene expression
counting was also implemented and included in the workflow in order to alleviate some
disadvantages of the existing algorithms. Second, developing a web application that allows the
analysis of differential gene expression of various experimental conditions simultaneously. The
GUI integrates all tools selected and allow tuning the configuration parameters of each tool.
Additionally, it provides a graphical display with the results obtained through the analysis.
The GUI uses the R Shiny and Shinydashboard libraries, and it improves usability and user
experience compared to the alternative of using command-line tools or sophisticated integration
tools not suitable for non-experienced users. The application was designed and implemented according
to a model-view-controller architectural pattern. The view and controller functionalities
are directly provided by Shiny and Shinydashboard libraries. The model consists of the selected
tools, and the data model is defined by the standard file formats generated during the analysis
of differential gene expression.
Finally, functional and non-functional requisites of the application were validated using
RNA-seq data from simulations and real experiments.
Files in this item
Google Scholar:Hernández Ballesteros, Susana
This item appears in the following Collection(s)
Except where otherwise noted, this item's license is described as https://creativecommons.org/licenses/by-nc-nd/4.0/
Related items
Showing items related by title, author, creator and subject.
-
Secuenciación de un fragmento de DNA del cromosoma VII de "Saccharomyces cerevisiae". Análisis funcional de las ORFs YGL133w, YGL134w, YGL136c, YGL138c, YGL142c e YGL144c
Escribano Hernández, M. Victoria
1998-03-27