Imputation of ancient genomes and the genomic history of the Rapanui
Details
Under embargo until 01/02/2025.
UNIL restricted access
State: Public
Version: After imprimatur
License: Not specified
UNIL restricted access
State: Public
Version: After imprimatur
License: Not specified
Serval ID
serval:BIB_B03FDDD4ECB2
Type
PhD thesis: a PhD thesis.
Collection
Publications
Institution
Title
Imputation of ancient genomes and the genomic history of the Rapanui
Director(s)
Malaspinas Anna-Sapfo
Institution details
Université de Lausanne, Faculté de biologie et médecine
Publication state
Accepted
Issued date
2024
Language
english
Abstract
The study of ancient DNA (aDNA) allows us to explain present-day genetic variation through access to past variation. Ancient DNA is damaged and, in most cases, only small amounts can be sequenced. On top of pervasive microbial contamination, potential contamination with DNA from closely-related species makes analyses unreliable. This thesis is split into two main topics with a focus on human aDNA: i) imputation of ancient human genomes, and ii) the genomic history of the Rapanui, the indigenous people of Rapa Nui (Easter Island).
Imputation holds great potential for aDNA as it produces accurate genotypes for low-coverage genomes, which are in the majority in this field. Here, we verified whether imputation can be re- liably applied to ancient genomes. We assessed imputation accuracy after imputing 42 downsam- pled high-coverage ancient genomes, whose high-coverage genotypes were used as the ground truth. Imputation yielded accurate genotypes for non-African genomes with more than 0.5x cov- erage and at common variants, introducing limited bias in standard downstream analyses. Finally, we verified how post-mortem damage (PMD) and contamination with human DNA affected im- putation. We found that PMD can decrease imputation accuracy, but the effect was small. The use of ATLAS, a genotype caller that takes PMD into account, improved imputation performance when PMD was high (42%), although simply trimming the ends of the sequenced reads had a similar effect. We also showed that contamination levels above 5% severely affected imputation by contaminating an ancient genome with sequenced reads from present-day genomes.
Rapa Nui is the closest Polynesian island to South America (∼3,700km). Well-known for its
gigantic stone statues, the moai, Rapa Nui is the most famous example of presumed ecological suicide: overexploitation of the islands’ resources resulting in famine, violence and population collapse in the 17th century. We sequenced 15 ancient Rapanui genomes dated to the beginning of the 19th century to investigate i) whether there is genetic evidence for a population collapse and ii) whether there was pre-European contact with the Americas. We found that the individuals were not closely related and had low inbreeding coefficients. Despite a low effective population size (maximum 2000 individuals), we show that the population steadily grew after the peopling of the island. Furthermore, effective population size and runs of homozygosity estimates for simulated genomes under strong population-collapse scenarios did not match the observed data. Finally, our
analyses of admixture shows that all ancient Rapanui have ∼10% Native American ancestry, as a
result of gene flow that took place in 1250-1430CE, pre-dating European contact in 1722CE.
--
L’étude de l’ADN ancien (ADNa) permet d’expliquer les variations génétiques actuelles à l’aide des variations passées. Souvent, seule une mince quantité d’ADN peut être extraite d’échantillons anciens. De plus, la contamination d’ADN microbien omniprésent et la contamination par des espèces proches rend les analyses peu fiables. Cette thèse couvre deux thèmes principaux : i) l’imputation des génomes humains anciens, et ii) l’histoire génomique des Rapanui, le peuple indigène de Rapa Nui (Île de Pâques).
L’imputation présente un grand potentiel pour l’ADNa, car elle permet de produire des géno- types précis pour les génomes à faible couverture comme ceux extraits d’échantillons anciens. Nous avons donc vérifié la fiabilité de l’imputation quand appliquée à des génomes anciens. Pour ce faire, nous avons évalué la précision de l’imputation de 42 génomes anciens pour lesquels les génotypes à certains sites sont connus grâce à une couverture élevée. L’imputation a permis d’obtenir des génotypes précis pour les génomes non africains ayant une couverture supérieure à 0,5 fois et pour les variants communs, introduisant peu de biais dans les analyses en aval. En- fin, nous avons vérifié comment les dommages post-mortem (DPM) et la contamination par de l’ADN humain affectent l’imputation. Nous avons constaté que les dommages post-mortem peu- vent diminuer la précision de l’imputation, mais que l’effet est faible. L’utilisation d’ATLAS, un outil de génotypage prenant en compte les DPM, a amélioré la performance de l’imputation lorsque ceux-ci étaient élevés (42%), bien que le simple fait de couper les extrémités des fragments d’ADN séquencés ait un effet similaire. En contaminant un génome ancien avec des fragments d’ADN provenant de génomes actuels, nous avons également montré que des niveaux de contamination supérieurs à 5% affectent grandement l’imputation.
Rapa Nui est l’île polynésienne la plus proche de l’Amérique du Sud (∼3 700 km). Bien con-
nue pour ses gigantesques statues de pierre, les moaï, Rapa Nui est l’exemple le plus célèbre de suicide écologique présumé : la surexploitation des ressources de l’île aurait entraîné famine, vio- lence et effondrement de la population au 17e siècle. Nous avons séquencé 15 génomes anciens de Rapanui datés du début du 19e siècle afin de déterminer i) s’il existe des preuves génétiques d’un effondrement de la population et ii) s’il y a eu un contact pré-européen avec les Amériques. Nous avons constaté que les individus n’étaient pas étroitement apparentés et que les coefficients de con- sanguinité étaient faibles. Malgré une faible taille effective de la population (max 2000 individus), nous montrons que la population a régulièrement augmenté après le peuplement de l’île. En outre, la taille effective de la population et les segments d’homozygotie pour les génomes simulés dans
des scénarios de fort effondrement ne correspondent pas aux données observées. Enfin, nos anal- yses de mixité montrent que tous les anciens Rapanui ont ∼10% d’ancêtres amérindiens, en raison du flux génétique qui a eu lieu entre 1250 et 1430CE, avant le contact avec les Européens en 1722CE.
Imputation holds great potential for aDNA as it produces accurate genotypes for low-coverage genomes, which are in the majority in this field. Here, we verified whether imputation can be re- liably applied to ancient genomes. We assessed imputation accuracy after imputing 42 downsam- pled high-coverage ancient genomes, whose high-coverage genotypes were used as the ground truth. Imputation yielded accurate genotypes for non-African genomes with more than 0.5x cov- erage and at common variants, introducing limited bias in standard downstream analyses. Finally, we verified how post-mortem damage (PMD) and contamination with human DNA affected im- putation. We found that PMD can decrease imputation accuracy, but the effect was small. The use of ATLAS, a genotype caller that takes PMD into account, improved imputation performance when PMD was high (42%), although simply trimming the ends of the sequenced reads had a similar effect. We also showed that contamination levels above 5% severely affected imputation by contaminating an ancient genome with sequenced reads from present-day genomes.
Rapa Nui is the closest Polynesian island to South America (∼3,700km). Well-known for its
gigantic stone statues, the moai, Rapa Nui is the most famous example of presumed ecological suicide: overexploitation of the islands’ resources resulting in famine, violence and population collapse in the 17th century. We sequenced 15 ancient Rapanui genomes dated to the beginning of the 19th century to investigate i) whether there is genetic evidence for a population collapse and ii) whether there was pre-European contact with the Americas. We found that the individuals were not closely related and had low inbreeding coefficients. Despite a low effective population size (maximum 2000 individuals), we show that the population steadily grew after the peopling of the island. Furthermore, effective population size and runs of homozygosity estimates for simulated genomes under strong population-collapse scenarios did not match the observed data. Finally, our
analyses of admixture shows that all ancient Rapanui have ∼10% Native American ancestry, as a
result of gene flow that took place in 1250-1430CE, pre-dating European contact in 1722CE.
--
L’étude de l’ADN ancien (ADNa) permet d’expliquer les variations génétiques actuelles à l’aide des variations passées. Souvent, seule une mince quantité d’ADN peut être extraite d’échantillons anciens. De plus, la contamination d’ADN microbien omniprésent et la contamination par des espèces proches rend les analyses peu fiables. Cette thèse couvre deux thèmes principaux : i) l’imputation des génomes humains anciens, et ii) l’histoire génomique des Rapanui, le peuple indigène de Rapa Nui (Île de Pâques).
L’imputation présente un grand potentiel pour l’ADNa, car elle permet de produire des géno- types précis pour les génomes à faible couverture comme ceux extraits d’échantillons anciens. Nous avons donc vérifié la fiabilité de l’imputation quand appliquée à des génomes anciens. Pour ce faire, nous avons évalué la précision de l’imputation de 42 génomes anciens pour lesquels les génotypes à certains sites sont connus grâce à une couverture élevée. L’imputation a permis d’obtenir des génotypes précis pour les génomes non africains ayant une couverture supérieure à 0,5 fois et pour les variants communs, introduisant peu de biais dans les analyses en aval. En- fin, nous avons vérifié comment les dommages post-mortem (DPM) et la contamination par de l’ADN humain affectent l’imputation. Nous avons constaté que les dommages post-mortem peu- vent diminuer la précision de l’imputation, mais que l’effet est faible. L’utilisation d’ATLAS, un outil de génotypage prenant en compte les DPM, a amélioré la performance de l’imputation lorsque ceux-ci étaient élevés (42%), bien que le simple fait de couper les extrémités des fragments d’ADN séquencés ait un effet similaire. En contaminant un génome ancien avec des fragments d’ADN provenant de génomes actuels, nous avons également montré que des niveaux de contamination supérieurs à 5% affectent grandement l’imputation.
Rapa Nui est l’île polynésienne la plus proche de l’Amérique du Sud (∼3 700 km). Bien con-
nue pour ses gigantesques statues de pierre, les moaï, Rapa Nui est l’exemple le plus célèbre de suicide écologique présumé : la surexploitation des ressources de l’île aurait entraîné famine, vio- lence et effondrement de la population au 17e siècle. Nous avons séquencé 15 génomes anciens de Rapanui datés du début du 19e siècle afin de déterminer i) s’il existe des preuves génétiques d’un effondrement de la population et ii) s’il y a eu un contact pré-européen avec les Amériques. Nous avons constaté que les individus n’étaient pas étroitement apparentés et que les coefficients de con- sanguinité étaient faibles. Malgré une faible taille effective de la population (max 2000 individus), nous montrons que la population a régulièrement augmenté après le peuplement de l’île. En outre, la taille effective de la population et les segments d’homozygotie pour les génomes simulés dans
des scénarios de fort effondrement ne correspondent pas aux données observées. Enfin, nos anal- yses de mixité montrent que tous les anciens Rapanui ont ∼10% d’ancêtres amérindiens, en raison du flux génétique qui a eu lieu entre 1250 et 1430CE, avant le contact avec les Européens en 1722CE.
Create date
28/08/2024 7:31
Last modification date
29/10/2024 11:43