Analysis of the impact of population copy number variation in introns
Author
Rigau de Llobet, MaríaEntity
UAM. Departamento de Bioquímica; Barcelona Supercomputing Center (BSC)Date
2019-06-21Funded by
This thesis was supported by a “La Caixa” – Severo Ochoa International PhD ProgrammeSubjects
Medicina - Tesis doctorales; Intrones - Tesis doctorales; Biología y Biomedicina / BiologíaNote
Tesis doctoral inédita leída en la Universidad Autónoma de Madrid, Facultad de Medicina, Departamento de Bioquímica. Fecha de lectura: 21-06-2019Esta obra está bajo una licencia de Creative Commons Reconocimiento-NoComercial-SinObraDerivada 4.0 Internacional.
Abstract
Introns cover most of the DNA sequence in human protein-coding genes and represent
approximately half of the non-coding genome. Very little is known about the patterns of
structural variation in introns and little attention has been paid to their functional
implications, even if several pathogenic intronic mutations have already been
characterized. Through the combined analysis of the five most extensive maps of Copy
Number Variants (CNVs) in human populations we show that intronic losses are the most
frequent type of CNV in protein-coding genes. The lower density of CNVs in introns
compared to intergenic regions supports the presence negative selection on intronic CNVs.
We identified many intronic deletions associated with gene expression changes by
integrating genotype with RNA-seq and promoter-capture Hi-C data, supporting the
implication of many CNVs in genetic regulation. Remarkably, a noteworthy number of these
associations are better interpreted by long-range genome interactions. Supporting the
possible impact of intronic CNVs on splicing, we have found 185 genes differentially
expressed transcripts associated with deletions. Moreover, we have found changes in exon
inclusion associated with deletions that alter the GC content of the intron. This finding
suggests that the structure of the fragments deleted in introns play a significant role on
which exons are included in the mature messenger RNA. Altogether, our findings
additionally support the substantial role of intronic CNVs on gene regulation.
Interestingly, we have observed that CNVs are not equally distributed among genes of
different evolutionary ages. Ancient genes are, in general, depleted of losses covering their
exons, but they carry the majority of intronic deletions, including intronic deletions
associated with expression changes. On the other hand, recent primate-specific genes are
enriched in CNVs implicating exons. Taken together, our findings suggest that CNVs have a
role in shaping gene evolution, possibly acting at different levels at large and short
evolutionary times (old and young genes). While in young genes CNVs contribute to directly
alter protein sequences, in ancient genes CNVs seem to be preferentially contributing to
population variability at the level of regulation with possible adaptive implications. Los intrones cubren la mayor parte de la secuencia de ADN en genes codificantes para
proteínas y representan aproximadamente la mitad del genoma no codificante en humanos.
Se sabe muy poco acerca de los patrones de variación estructural en los intrones y se ha
prestado poca atención a sus implicaciones funcionales, incluso si ya se han caracterizado
varias mutaciones intrónicas patógenicas. A través del análisis combinado de los cinco
mapas más extensos de las Variantes en Número de Copia (CNVs) en poblaciones humanas,
mostramos que las pérdidas intrónicas son el tipo más frecuente de CNV en los genes
codificantes para proteínas. La menor densidad de CNVs en intrones en comparación con
regiones intergénicas sugiere la presencia de selección negativa sobre las CNVs intrónicas.
Integrando datos de CNVs con datos de RNA-seq y PCHi-C hemos identificado deleciones
intrónicas asociadas a cambios en la expresión génica. Parte de estas asociaciones se
interpretan mejor por interacciones genómicas entre fragmentos distantes. Apoyando el
posible papel de las CNVs intrónicas en el proceso de splicing, hemos encontrado 185 genes
con tránscritos diferentialmente expresados en los individuos con deleciones. Además,
hemos encontrado cambios en la inclusión de exones asociados a CNVs que alteran el
contenido GC del intrón. Esto sugiere que la estructura de los fragmentos perdidos en los
intrones desempeña un papel importante en la selección de exones en el splicing. En
conjunto, nuestros hallazgos muestran el importante papel de las CNVs intrónicas en la
regulación génica.
Curiosamente, hemos observado que las CNV no están distribuidas equitativamente entre
los genes de diferentes edades evolutivas. Los genes antiguos están empobrecidos de
pérdidas en sus exones pero tienen la mayoría de deleciones intrónicas, incluidas muchas
de las asociadas a cambios de expresión. Por otro lado, los genes recientes están
enriquecidos en CNVs exónicas. Nuestros hallazgos sugieren que las CNVs contribuyen a la
evolución de los genes, posiblemente actuando a diferentes niveles en genes antiguos y
jóvenes. Mientras que en los genes jóvenes las CNVs contribuyen a alterar directamente las
secuencias de proteínas, en los antiguos, las CNVs parecen estar contribuyendo de manera
preferencial a la variabilidad en la regulación, con posibles implicaciones adaptativas
Files in this item
Google Scholar:Rigau de Llobet, María
This item appears in the following Collection(s)
Related items
Showing items related by title, author, creator and subject.
-
Combining targeted panel-based resequencing and copy-number variation analysis for the diagnosis of inherited syndromic retinopathies and associated ciliopathies
Sánchez-Navarro, Iker; Da Silva, Luciana R.J.; Blanco-Kelly, Fiona; Zurita, Olga; Sánchez-Bolivar, Noelia; Villaverde, Cristina; López-Molina, María Isabel; García-Sandoval, Blanca; Tahsin-Swafiri, Saoud; Minguez, Pablo; Riveiro Álvarez, Rosa; Lorda, Isabel; Sánchez-Alcudia, Rocío; Pérez-Carro, Raquel; Valverde, Diana; Liu, Yichuan; Tian, Lifeng; Hakonarson, Hakon; Ávila-Fernández, Almudena; Corton, Marta; Ayuso, Carmen
2018-12-01