Evolution of untranslated régions of mRNAs in primates


Request a copy
Serval ID
PhD thesis: a PhD thesis.
Evolution of untranslated régions of mRNAs in primates
Hernandez N.
Kaessmann H., Necsulea A.
Institution details
Université de Lausanne, Faculté de biologie et médecine
Faculté de biologie et de médecineUniversité de LausanneCH-1015 LausanneSUISSE
Publication state
Issued date
Until recently, functional and evolutionary studies have focused almost exclusively on protein- coding sequences, but it has become increasingly clear that noncoding genomic régions harbour a wealth of functional information. The untranslated régions (UTRs) of protein-coding mRNAs are one such example, playing an important rôle in posttranscriptional régulation, for instance translational control and efficiency, mRNA stability and mRNA subcellular localisation. Nevertheless, due to incomplète UTR annotations in non-model organisms, functional rôles of UTRs and especially their evolutionary dynamics continue to be poorly understood. In this study we focused on the primates, so we first focused improving genomic annotations, and in particular, UTR annotations across primates. To do that, we used RNA-seq information to complété the annotations of protein-coding genes, by adding new exons and new exon boundaries to existing Ensembl annotations. To compensate for différence in samples in RNA-seq data and coverage, we projected the new annotations from one species to ail other species. We were able to add thousands of new exons and new alternative splice sites, the majority being previously unannotated UTR exons. We classifïed the sequences into UTR or coding based on their evolutionary signature, and using start and stop codons as additional criteria.
We sought to study how UTR exon usage differs across tissues. We detected that UTR exons are more often differentially used across tissues compared to coding exons. Moreover, différent organs exhibit différent exon usage patterns. Particularly in testis we detect l) high proportion of 5' UTR exons that are more often used in testis compared to other tissues and 2) high proportion of 3' UTR exons that are less used in testis. We detected a motif present in ail alternative promoters used specifically in testis. Also, we showed that 3' UTR sequences that are less used in testis have high number of predicted HuR protein binding sites, indicating avoidance of these binding sites.
Finally, we wanted to investigate how UTR usage evolves across primates. We demonstrated that contrary to what has been shown, alternative polyadenylation usage evolves rapidly. We also detect that UTR usage is as often lineage-specific as coding exon usage and it has higher effect size of usage change. We detect higher proportion of lineage-specific tissue-specific exons in testis compared to other tissues suggesting that new isoforms might first arise in testis. Additionally, we detect conserved tissue-specific exons usage across species, and surprisingly, proportion of conserved UTRs is higher than proportion of conserved coding exons implying a spécial rôle of UTRs in tissue-dependent posttranscriptional régulation.
To conclude, we created the first comparable annotations for 6 primate species and we believe these annotations will be of great value to the scientific community. Additionally, we performed the first large-scale evolutionary study of primate UTRs, discovering tissue and/or lineage spécifié UTR usage of potential functional conséquences.
Dans le domaine de la génomique évolutive, la plupart des études se sont focalisées jusqu'à présent sur les régions qui codent pour des protéines. Cependant, il est maintenant évident que les régions non-codantes des génomes contiennent de nombreuses informations fonctionnelles. En particulier, les régions non-traduites (« untranslated régions » en anglais, d'où l'abréviation UTR) des ARNs messagers jouent des rôles importants dans le contrôle de l'expression des gènes et de la production de protéines, dans la stabilité des ARNs messagers etc. A présent, les rôles fonctionnels et en particulier la dynamique évolutive des UTRs ne sont toujours pas parfaitement compris.
Le premier objectif de cette thèse était d'améliorer les annotations des UTRs dans les génomes de primates. Nous avons utilisé des données de séquençage de transcriptome pour compléter les annotations des gènes codants pour des protéines, en ajoutant de nouveaux exons ou en étendant les frontières existantes des exons. Nous avons également utilisé une approche de projection entre espèces pour améliorer la comparabilité des annotations. Nous avons utilisé la signature évolutive des séquences d'ADN pour déterminer si elles correspondent à des régions codantes pour des protéines ou, au contraire, à des éléments non-codants. Nous avons ainsi identifié de milliers de nouveaux exons, dont la majorité correspond à des UTRs.
Le deuxième objectif était d'étudier les variations des UTRs entre tissus. Nous avons démontré que l'usage différentiel des UTRs présente la même quantité de variation entre tissus que l'usage différentiel d'exons codants. Les patrons d'utilisation des différents UTRs varient donc considérablement entre tissus. En particulier, nous avons détecté une proportion élevée de 5'-UTRs qui sont utilisés préférentiellement dans les testicules, et une proportion élevées de 3'-UTRs qui sont - au contraire - évités dans les testicules. Nous avons identifié un motif de fixation d'un facteur de transcription qui est commun à tous les promoteurs utilisés spécifiquement dans les testicules. Nous avons également détecté un enrichissement en motifs de fixation de la protéine HuR dans les régions 3'-UTRs évitées dans cet organe.
Enfin, nous avons étudié l'évolution des UTRs chez les primates. Nous avons démontré que l'évolution de l'utilisation des sites alternatifs de polyadenylation évolue rapidement. De même, nos résultats montrent que l'utilisation différentielle des UTRs est plus souvent spécifique à une lignée ou à une espèce que l'utilisation différentielle des exons codants. La plupart des UTRs spécifiques à une lignée sont détectés dans les testicules, ce qui suggère que les nouveaux isoformes sont préférentiellement exprimés dans cet organe. Nous avons identifié de nombreux UTRs qui utilisés spécifiquement dans un organe, dans plusieurs espèces, indiquant que ces régions pourraient avoir un rôle important dans les réseaux de régulation qui définissent l'identité des organes.
Create date
19/08/2016 16:08
Last modification date
20/08/2019 14:50
Usage data