Haplotypes in complex traits genetics

Details

Ressource 1Download: thése-HR-OK.pdf (17193.00 [Ko])
State: Public
Version: After imprimatur
License: Not specified
Serval ID
serval:BIB_49346D79C118
Type
PhD thesis: a PhD thesis.
Collection
Publications
Institution
Title
Haplotypes in complex traits genetics
Author(s)
Hofmeister Robin
Director(s)
Delaneau Olivier
Codirector(s)
Bergmann Sven
Institution details
Université de Lausanne, Faculté de biologie et médecine
Publication state
Accepted
Issued date
2023
Language
english
Abstract
Humans are genetically 99.9% identical. Can you believe it? However, despite this close similarity, even the slightest variation in the remaining 0.1% can lead to significant differences in phenotypic traits and disease susceptibility. Biobanks have greatly increased our understanding of how genetic variations affect complex traits through Genome-Wide Association Studies (GWAS) by collecting genetic and phenotypic data for hundreds of thousands of individuals. However, efficient data processing methods are crucial to fully exploit their potential. Despite the progress made, there is still a wealth of untapped information in biobanks that could revolutionize our understanding of complex traits. Haplotypes are a promising resource in this regard, as they can be inferred directly from genotypes without requiring additional recruitment or data collection.
In this thesis, I explored the use of haplotypes to maximize the potential of existing biobanks and enhance the characterization of the impact of genetic variants on complex traits. To achieve this, I have developed innovative methods for estimating haplotypes from large biobanks (Chapter I) and inferring the parental origin of the resulting haplotypes (Chapter II).
Chapter I presents a method to estimate haplotypes and describes the phasing of the UK Biobank whole-genome and whole-exome sequencing data. It illustrates the importance of the resulting haplotype estimates to discover rare genetic conditions called Compound Heterozygotes (CH). These occur when an individual carries two non-identical copies of loss-of-function mutations, one inherited from each parent, resulting in a double gene knockout. In addition, this chapter shows how my haplotype estimates improve imputation accuracy, especially at rare variants that are under-represented in smaller cohorts, enhancing the ability to capture causal variants in downstream GWAS.
Chapter II presents an innovative approach to determine the parent-of-origin of haplotypes that does not rely on prior knowledge of parental genomes. I first demonstrate how this information can be used to discover phenotypic effects that depend on the parent-of-origin of the genetic variant, referred to as parent-of-origin effects. In addition, I also illustrate the importance of the parent-of-origin of haplotypes to identify genetic factors involved in human fertility, by detecting genetic variants whose inheritance deviates from the expected Mendelian inheritance pattern.
--
Les humains sont génétiquement identiques à 99,9 %. Pouvez-vous le croire? Cependant, malgré cette similitude étroite, la moindre variation dans les 0,1 % restants peut entraîner des différences significatives dans les traits phénotypiques et la susceptibilité aux maladies. Les biobanques ont considérablement amélioré notre compréhension de la façon dont les variations génétiques affectent les traits complexes grâce aux études d'association à l'échelle du génome entier (GWAS) en collectant des données génétiques et phénotypiques pour des centaines de milliers d'individus. Cependant, des méthodes efficaces de traitement des données sont cruciales pour exploiter pleinement leur potentiel. Malgré les progrès réalisés, il existe encore une mine d'informations inexploitées dans les biobanques qui pourraient révolutionner notre compréhension des traits complexes. Les haplotypes sont une ressource prometteuse à cet égard, car ils peuvent être déduits directement des génotypes sans nécessiter de recrutement ou de collecte de données supplémentaires.
Dans cette thèse, j'ai exploré l'utilisation des haplotypes pour maximiser le potentiel des biobanques existantes et améliorer la caractérisation de l'impact des variants génétiques sur les traits complexes. Pour y parvenir, j’ai développé des méthodes innovantes d'estimation d'haplotypes à partir de grandes biobanques (Chapitre I) et d'inférence de l'origine parentale de ces haplotypes (Chapitre II).
Le chapitre I présente une méthode pour estimer les haplotypes et décrit le phasage des données de séquençage du génome entier et de l'exome entier de UK Biobank. Il illustre l'importance des estimations d'haplotypes pour découvrir des conditions génétiques rares appelées hétérozygotes composés (CH). Ces conditions surviennent lorsqu'un individu porte deux copies non-identiques de mutation perte de fonction, une héritée de chaque parent, entraînant une double inactivation du gène. En outre, ce chapitre montre comment mes estimations d'haplotype améliorent la précision de l'imputation, en particulier pour les variantes rares qui sont sous-représentées dans les cohortes plus petites, améliorant ainsi la capacité de capturer les variantes causales dans les GWAS.
Le chapitre II présente une approche innovante pour déterminer le l’origine parentale des haplotypes qui ne repose pas sur une connaissance préalable des génomes parentaux. Je démontre premièrement comment ces informations peuvent être utilisées pour découvrir des effets phénotypiques qui dépendent de l’origine parentale de la variation génétique, appelés effets d'origine parentale. En outre, j’illustre l'importance de l’origine parentale des haplotypes pour identifier les facteurs génétiques impliqués dans la fertilité humaine, en détectant les variations génétiques dont l'héritage s'écarte du modèle d'héritage mendélien attendu.
Create date
05/09/2023 12:07
Last modification date
13/09/2023 7:10
Usage data