Functional évolution of retrogenes and regulatory régions in mammals
Details
Serval ID
serval:BIB_23E5C637B4D1
Type
PhD thesis: a PhD thesis.
Collection
Publications
Institution
Title
Functional évolution of retrogenes and regulatory régions in mammals
Director(s)
Claudia Marques A.
Codirector(s)
Kaessmann H., Fankhauser C.
Institution details
Université de Lausanne, Faculté de biologie et médecine
Address
Faculté de biologie et de médecineUniversité de LausanneCH-1015 LausanneSUISSE
Publication state
Accepted
Issued date
2016
Language
english
Abstract
Différences in coding sequences and reguiatory régions underlie much of the morphological, physiological and behavioural variation observed within and between species. A number of studies have linked the émergence of several adaptive traits to specific coding or reguiatory mutations, and the continuative development of techniques allowing large-scale analyses of gene expression and régulation is providing new tools to investigate the molecular causes of phenotypic variation in a more extensive and efficient way. In my thesis I used a combination of genome-wide profiles of gene expression and chromatin architecture to explore the évolution of RNA-based gene duplication and to describe the functional repurposing of reguiatory elements in mammals.
In my first project I investigated the life history of retrocopies, gene duplicates that originate from the mRNA of their respective parental genes. Previous studies provided important insights into retrocopy biology, and established these gene copies as useful models to explore the évolution of new genes. In my work, I comprehensively characterized the sources of retrocopy promoters, showing that a large part of these reguiatory elements evolved de novo or from proto-promoter régions, such as orphan CpG islands and putative ancestral enhancers. Through the analysis of retrocopy coding sequence évolution, I identified between 88 and 260 putatively functional retrocopies (retrogenes) in the investigated mammals. A large fraction of retrogenes evolved new multiexonic structures that probably facilitated the recruitment of distal reguiatory elements, and many of these functional copies showed expression of alternative isoforms. Ail these findings thus indicated that some retrogenes have evolved structures and functionalities similar to those of any other gene. The analysis of "orphan" retrogenes further supported this notion, revealing that in some cases new copies can possibly take over the parental function.
The évolution of reguiatory régions of retrocopies from proto-promoters, and particularly the evidence of co-option of putative enhancers as novel promoters, was the basis for my second thesis project. In this work, I investigated the occurrence of changes in the function of reguiatory elements at a large scale in the primate and rodent lineage. After defining candidate enhancers and promoters through the combination of gene expression, DNAse hypersensitivity and chromatin modification data, I compared the activity of reguiatory sequences in closely related species. Using this approach I detected 305 orthologous régions with divergent functions across species, suggesting that these elements experienced functional repurposing. The analysis of such malleable elements in outgroup species revealed that most turnover events consisted in the conversion of an ancestral enhancer into a novel promoter, hinting at a bias in the repurposing process. Sequence analysis highlighted différences in GC content and in the frequency of U1 motifs between malleable elements and other reguiatory régions. Importantly, sequence différences were observed also between pairs of orthologous malleable loci, and correlated with the functional changes experienced by these loci. These observations thus suggested that variation in nucleotide and motif composition of regulatory sequenees eould potentially underlie the functional repurposing of these elements in mammals.
--
Les différences dans les séquences régulatrices et les régions de codage sous-tendent une grande partie de la variation morphologique, physiologique et comportementale observée au sein et entre les espèces. Nombreuses études ont lié l'apparition de plusieurs caractères adaptatifs à des mutations spécifiques dans les régions codantes ou régulatrices. De plus, le développement constant de techniques permettant l'analyse d'expression et la régulation génique à grande échelle fournit de nouveaux outils pour l'investigation des bases moléculaires causant la variation phénotypique, d'une façon plus extensive et efficace. Dans ma thèse, j'ai utilisé une combinaison de profils d'expression des gènes et d'architecture de la chromatine « genome-wide » pour étudier l'évolution de la duplication de gènes issus de l'ARN et pour caractériser la réorientation fonctionnelle des éléments régulateurs chez les mammifères.
Dans mon premier projet, j'ai étudié l'histoire de l'évolution des rétro-copies, des gènes dupliqués qui proviennent de l'ARNm issus de leurs gènes parentaux respectifs. Des études antérieures ont fourni des indications importantes sur la biologie des rétro-copies, et ont établi qu'il s'agit de modèles très utiles pour investiguer l'évolution de nouveaux gènes. Dans mon travail, j'ai caractérisé globalement les sources de promoteurs des rétro-copies montrant qu'une grande partie de ces éléments régulateurs a évolué de novo ou à partir des séquences proto-promotrices, comme les îles CpG et de séquences « enhancers » potentielles ancestrales. Grâce à l'analyse de l'évolution des séquences codantes de rétro-copies, j'ai identifié entre 88 et 260 rétro-copies potentiellement fonctionnelles (rétrogènes) dans les mammifères étudiés. De nouvelles structures multi-exoniques ont évolué d'une grande partie des rétrogènes qui ont probablement facilité le recrutement d'éléments régulateurs distaux, et beaucoup de ces copies fonctionnelles ont montré l'expression d'isoformes alternatives. Tous ces résultats indiquent ainsi que des structures et des fonctionnalités similaires à celles des autres gènes ont évolué de certains rétrogènes. L'analyse des rétrogènes «orphelins» soutient cette hypothèse, révélant que, dans certains cas, les copies nouvelles peuvent éventuellement prendre en charge la fonction parentale.
L'évolution des régions régulatrices de retrocopies à partir de proto-promoteurs, et en particulier la preuve de la captation d'enhancers potentiels en tant que nouveaux promoteurs, a constitué la base pour mon deuxième projet de thèse. Dans ce travail, j'ai étudié l'apparition de changements de fonction des éléments régulation à grande échelle dans la lignée des primates et des rongeurs. Après avoir identifié les enhancers et les promoteurs potentiels par l'analyse de l'ensemble des données relatives a l'expression génique, a l'hypersensibilité à la DNAse et à la modification de la chromatine, j'ai comparé l'activité de ces séquences régulatrices dans les espèces étroitement apparentées. En utilisant cette approche, j'ai détecté 305 régions orthologues avec des fonctions divergentes à travers les espèces, ce qui suggère que ces éléments ont subi un changement fonctionnel. L'analyse de ces éléments malléables dans les espèces « outgroup » a révélé que la plupart des changements ont consisté en la transformation d'un activateur ancestral en un nouveau promoteur, ce qui indique un certain « biais » dans le processus de réorientation.
L'analyse des séquences a mis en évidence des différences de teneur en GC et des motifs U1 entre les éléments malléables et les autres régions régulatrices. Fait important, les différences de séquences ont été observées aussi entre les paires de loci malléable orthologues, et en corrélation avec les changements fonctionnels rencontrés par ces loci. Ces résultats suggèrent donc que les différences dans la composition nucléotidique des séquences régulatrices pourraient sous-tendre la réorientation fonctionnelle de ces éléments chez les mammifères.
In my first project I investigated the life history of retrocopies, gene duplicates that originate from the mRNA of their respective parental genes. Previous studies provided important insights into retrocopy biology, and established these gene copies as useful models to explore the évolution of new genes. In my work, I comprehensively characterized the sources of retrocopy promoters, showing that a large part of these reguiatory elements evolved de novo or from proto-promoter régions, such as orphan CpG islands and putative ancestral enhancers. Through the analysis of retrocopy coding sequence évolution, I identified between 88 and 260 putatively functional retrocopies (retrogenes) in the investigated mammals. A large fraction of retrogenes evolved new multiexonic structures that probably facilitated the recruitment of distal reguiatory elements, and many of these functional copies showed expression of alternative isoforms. Ail these findings thus indicated that some retrogenes have evolved structures and functionalities similar to those of any other gene. The analysis of "orphan" retrogenes further supported this notion, revealing that in some cases new copies can possibly take over the parental function.
The évolution of reguiatory régions of retrocopies from proto-promoters, and particularly the evidence of co-option of putative enhancers as novel promoters, was the basis for my second thesis project. In this work, I investigated the occurrence of changes in the function of reguiatory elements at a large scale in the primate and rodent lineage. After defining candidate enhancers and promoters through the combination of gene expression, DNAse hypersensitivity and chromatin modification data, I compared the activity of reguiatory sequences in closely related species. Using this approach I detected 305 orthologous régions with divergent functions across species, suggesting that these elements experienced functional repurposing. The analysis of such malleable elements in outgroup species revealed that most turnover events consisted in the conversion of an ancestral enhancer into a novel promoter, hinting at a bias in the repurposing process. Sequence analysis highlighted différences in GC content and in the frequency of U1 motifs between malleable elements and other reguiatory régions. Importantly, sequence différences were observed also between pairs of orthologous malleable loci, and correlated with the functional changes experienced by these loci. These observations thus suggested that variation in nucleotide and motif composition of regulatory sequenees eould potentially underlie the functional repurposing of these elements in mammals.
--
Les différences dans les séquences régulatrices et les régions de codage sous-tendent une grande partie de la variation morphologique, physiologique et comportementale observée au sein et entre les espèces. Nombreuses études ont lié l'apparition de plusieurs caractères adaptatifs à des mutations spécifiques dans les régions codantes ou régulatrices. De plus, le développement constant de techniques permettant l'analyse d'expression et la régulation génique à grande échelle fournit de nouveaux outils pour l'investigation des bases moléculaires causant la variation phénotypique, d'une façon plus extensive et efficace. Dans ma thèse, j'ai utilisé une combinaison de profils d'expression des gènes et d'architecture de la chromatine « genome-wide » pour étudier l'évolution de la duplication de gènes issus de l'ARN et pour caractériser la réorientation fonctionnelle des éléments régulateurs chez les mammifères.
Dans mon premier projet, j'ai étudié l'histoire de l'évolution des rétro-copies, des gènes dupliqués qui proviennent de l'ARNm issus de leurs gènes parentaux respectifs. Des études antérieures ont fourni des indications importantes sur la biologie des rétro-copies, et ont établi qu'il s'agit de modèles très utiles pour investiguer l'évolution de nouveaux gènes. Dans mon travail, j'ai caractérisé globalement les sources de promoteurs des rétro-copies montrant qu'une grande partie de ces éléments régulateurs a évolué de novo ou à partir des séquences proto-promotrices, comme les îles CpG et de séquences « enhancers » potentielles ancestrales. Grâce à l'analyse de l'évolution des séquences codantes de rétro-copies, j'ai identifié entre 88 et 260 rétro-copies potentiellement fonctionnelles (rétrogènes) dans les mammifères étudiés. De nouvelles structures multi-exoniques ont évolué d'une grande partie des rétrogènes qui ont probablement facilité le recrutement d'éléments régulateurs distaux, et beaucoup de ces copies fonctionnelles ont montré l'expression d'isoformes alternatives. Tous ces résultats indiquent ainsi que des structures et des fonctionnalités similaires à celles des autres gènes ont évolué de certains rétrogènes. L'analyse des rétrogènes «orphelins» soutient cette hypothèse, révélant que, dans certains cas, les copies nouvelles peuvent éventuellement prendre en charge la fonction parentale.
L'évolution des régions régulatrices de retrocopies à partir de proto-promoteurs, et en particulier la preuve de la captation d'enhancers potentiels en tant que nouveaux promoteurs, a constitué la base pour mon deuxième projet de thèse. Dans ce travail, j'ai étudié l'apparition de changements de fonction des éléments régulation à grande échelle dans la lignée des primates et des rongeurs. Après avoir identifié les enhancers et les promoteurs potentiels par l'analyse de l'ensemble des données relatives a l'expression génique, a l'hypersensibilité à la DNAse et à la modification de la chromatine, j'ai comparé l'activité de ces séquences régulatrices dans les espèces étroitement apparentées. En utilisant cette approche, j'ai détecté 305 régions orthologues avec des fonctions divergentes à travers les espèces, ce qui suggère que ces éléments ont subi un changement fonctionnel. L'analyse de ces éléments malléables dans les espèces « outgroup » a révélé que la plupart des changements ont consisté en la transformation d'un activateur ancestral en un nouveau promoteur, ce qui indique un certain « biais » dans le processus de réorientation.
L'analyse des séquences a mis en évidence des différences de teneur en GC et des motifs U1 entre les éléments malléables et les autres régions régulatrices. Fait important, les différences de séquences ont été observées aussi entre les paires de loci malléable orthologues, et en corrélation avec les changements fonctionnels rencontrés par ces loci. Ces résultats suggèrent donc que les différences dans la composition nucléotidique des séquences régulatrices pourraient sous-tendre la réorientation fonctionnelle de ces éléments chez les mammifères.
Create date
04/10/2016 10:33
Last modification date
20/08/2019 13:01