Exploring differential activation of topologically associating domains in cancer
Details
Serval ID
serval:BIB_B37292166FA1
Type
PhD thesis: a PhD thesis.
Collection
Publications
Institution
Title
Exploring differential activation of topologically associating domains in cancer
Director(s)
Ciriello Giovanni
Institution details
Université de Lausanne, Faculté de biologie et médecine
Publication state
Accepted
Issued date
2021
Language
english
Abstract
ln the heart of eukaryotic cells, the nucleus encloses the genetic material that is transmitted over generations. ln human, this consists of 46 ONA molecules - ~2 m long when stretched out - com pacted to fit into a circular micrometer-scale structure. How this feat is achieved raises a longstand ing research topic. By translating three-dimensional coordinates into chromatin contacts, techniques based on chromosome conformation capture (3C) - high-throughput 3C (Hi-C) in particular - permit to interrogate the spatial arrangement of chromatin in a genome-wide manner and at unprecedented resolution.
These modern techniques, unveiled hitherto unrecognised levels of chromatin folding. To date, three of them caught most of the attention: kilobase-scale loops, (sub-)megabase demains and multi-megabase compartments. Among these, the intermediate structures, commonly referred to as "topologically associating demains" (TAOs), arguably remain the most fluctuating concept. Specifi cally, the interplay between TAOs and transcription still suffers from umpteen grey areas. This will hence be the core of this thesis.
ln the first part of my work, 1 tackled the definition of TAOs, by comparing dozens of software devised to automatize their detection in Hi-C matrices. This benchmarking study notably emphasizes how data quality and/or processing can affect the performance of TAO callers, thereby what is in fine considered as a TAO.
The identification of an appropriate tool enabled me to address, in the second chapter, their func tional importance in EZH2-mutant lymphomas characterized by increased level of the repressive histone mark H3K27me3. This case study offered the opportunity to explore the repercussions of this epigenetic alteration on genome compartmentalization and gene expression. Among others, this project revealed overall concordant transcriptional changes at the level of TAOs. Remarkably, our TAO-level analysis led to the discovery of a repressed demain encompassing co-regulated tumor suppressors in which a rewiring of promoter-promoter interactions also occurred. Of therapeutical relevance, EZH2 inhibitor treatment reverted the effects of the mutation.
This finding prompted me to explore intra-TAO co-regulation in a more systematic way by developing a tactic to detect TAOs that are up- or down-regulated between two experimental conditions. By applying it on datasets from The Cancer Genome Atlas, such an approach carries the potential to facilitate the identification of expression modules involved in tumorigenesis. More generally, this algorithm could inform in which contexts the demain organization of the chromatin is relevant for gene expression.
ln conclusion, my analyses outline methodological precautions to be taken when dealing with Hi-C data, contribute to a better characterization of chromatin architecture in cancer and deliver to the community a strategy for exploring intra-TAO co-regulation in a wide variety of biological processes.
--
Au coeur des cellules eucaryotes, le noyau renferme le matériel génétique transmis génération après génération. Chez l'homme, cela représente 46 molécules - longues de ~ 2 m une fois dépliées - compactées dans une structure circulaire de l'échelle du micromètre. Comment cette prouesse est achevée constitue un sujet de recherche de longue date. En traduisant des coordonnées 30 en contacts de chromatine, les techniques basées sur la capture de la conformation chromosomique (3C) - la 3C à haut débit (Hi-C) en particulier - ont permis d'interroger l'arrangement spatial de la chromatine sur l'ensemble du génome et à une résolution sans précédent.
Ces techniques modernes ont dévoilé des niveaux de repliement de la chromatine jusque-là méconnus. A ce jour, trois parmi eux ont retenu la plus grande part de l'attention: à l'échelle du kilobase des boucles, à celle du (sub-)mégabase des domaines et à celle du multi-mégabase des compartiments. De ceux-ci, les structures intermédiaires, couramment dénommées "domaines d'association topologique" (TADs), restent vraisemblablement le concept le plus fluctuant. En particulier, les modalités de l'interaction entre TADs et transcription souffrent toujours de nombreuses zones grises. Cela constituera donc le coeur de ma thèse.
Dans la première partie de mon travail, j'aborde la définition des TADs, en comparant d'une vingtaine de logiciels conçus pour automatiser leur détection dans les matrices Hi-C. Cette étude comparative met notamment en évidence la façon dont la qualité et/ou le traitement des données peut impacter ces détecteurs de TADs, questionnant ainsi ce qui est in fine considéré comme TAO.
L'identification d'un logiciel adéquat m'a permis de me pencher, dans le second chapitre, sur leur importance fonctionnelle dans les lymphomes porteurs d'une mutation dans le gène EZH2 caractérisés par un niveau élevé de la marque d'histone répressive H3K27me3. Cette étude de cas m'a offert l'opportunité d'explorer les répercussions de cette altération épigénétique sur la compartimentation et l'expression des gènes. Entre autres, ce projet a révélé des changements transcriptionnels concordants au niveau des TADs. De façon remarquable, les analyses menées à l'échelle des TADs ont conduit à la découverte d'un domaine réprimé comprenant des gènes suppresseurs de tumeurs co-régulés au sein duquel a également lieu un recâblage des interactions entre promoteurs. D'intérêt thérapeutique, un traitement avec un inhibiteur de EZH2 inverse les effets de la mutations.
Ces résultats m'ont incitée à explorer la co-régulation à l'intérieur des TADs de manière plus systématique en développant une méthode pour détecter les TADs qui sont activés ou réprimés entre deux conditions expérimentales. En l'appliquant sur des jeux de données de The Cancer Genome Atlas , une telle approche a le potentiel de mener à l'identification de modules fonctionnels impliqués dans la tumorigenèse. Plus généralement, cet algorithme pourrait renseigner dans quels contextes l'organisation en domaines de la chromatine est importante pour l'expression des gènes.
En conclusion, mes analyses soulignent les précautions méthodologiques à prendre lors du traite ment de données Hi-C, contribuent à une meilleure caractérisation de l'architecture de la chromatine dans le cancer et fournissent à la communauté une stratégie pour explorer la co-régulation à l'intérieur des TADs dans une large variété de processus biologiques.
These modern techniques, unveiled hitherto unrecognised levels of chromatin folding. To date, three of them caught most of the attention: kilobase-scale loops, (sub-)megabase demains and multi-megabase compartments. Among these, the intermediate structures, commonly referred to as "topologically associating demains" (TAOs), arguably remain the most fluctuating concept. Specifi cally, the interplay between TAOs and transcription still suffers from umpteen grey areas. This will hence be the core of this thesis.
ln the first part of my work, 1 tackled the definition of TAOs, by comparing dozens of software devised to automatize their detection in Hi-C matrices. This benchmarking study notably emphasizes how data quality and/or processing can affect the performance of TAO callers, thereby what is in fine considered as a TAO.
The identification of an appropriate tool enabled me to address, in the second chapter, their func tional importance in EZH2-mutant lymphomas characterized by increased level of the repressive histone mark H3K27me3. This case study offered the opportunity to explore the repercussions of this epigenetic alteration on genome compartmentalization and gene expression. Among others, this project revealed overall concordant transcriptional changes at the level of TAOs. Remarkably, our TAO-level analysis led to the discovery of a repressed demain encompassing co-regulated tumor suppressors in which a rewiring of promoter-promoter interactions also occurred. Of therapeutical relevance, EZH2 inhibitor treatment reverted the effects of the mutation.
This finding prompted me to explore intra-TAO co-regulation in a more systematic way by developing a tactic to detect TAOs that are up- or down-regulated between two experimental conditions. By applying it on datasets from The Cancer Genome Atlas, such an approach carries the potential to facilitate the identification of expression modules involved in tumorigenesis. More generally, this algorithm could inform in which contexts the demain organization of the chromatin is relevant for gene expression.
ln conclusion, my analyses outline methodological precautions to be taken when dealing with Hi-C data, contribute to a better characterization of chromatin architecture in cancer and deliver to the community a strategy for exploring intra-TAO co-regulation in a wide variety of biological processes.
--
Au coeur des cellules eucaryotes, le noyau renferme le matériel génétique transmis génération après génération. Chez l'homme, cela représente 46 molécules - longues de ~ 2 m une fois dépliées - compactées dans une structure circulaire de l'échelle du micromètre. Comment cette prouesse est achevée constitue un sujet de recherche de longue date. En traduisant des coordonnées 30 en contacts de chromatine, les techniques basées sur la capture de la conformation chromosomique (3C) - la 3C à haut débit (Hi-C) en particulier - ont permis d'interroger l'arrangement spatial de la chromatine sur l'ensemble du génome et à une résolution sans précédent.
Ces techniques modernes ont dévoilé des niveaux de repliement de la chromatine jusque-là méconnus. A ce jour, trois parmi eux ont retenu la plus grande part de l'attention: à l'échelle du kilobase des boucles, à celle du (sub-)mégabase des domaines et à celle du multi-mégabase des compartiments. De ceux-ci, les structures intermédiaires, couramment dénommées "domaines d'association topologique" (TADs), restent vraisemblablement le concept le plus fluctuant. En particulier, les modalités de l'interaction entre TADs et transcription souffrent toujours de nombreuses zones grises. Cela constituera donc le coeur de ma thèse.
Dans la première partie de mon travail, j'aborde la définition des TADs, en comparant d'une vingtaine de logiciels conçus pour automatiser leur détection dans les matrices Hi-C. Cette étude comparative met notamment en évidence la façon dont la qualité et/ou le traitement des données peut impacter ces détecteurs de TADs, questionnant ainsi ce qui est in fine considéré comme TAO.
L'identification d'un logiciel adéquat m'a permis de me pencher, dans le second chapitre, sur leur importance fonctionnelle dans les lymphomes porteurs d'une mutation dans le gène EZH2 caractérisés par un niveau élevé de la marque d'histone répressive H3K27me3. Cette étude de cas m'a offert l'opportunité d'explorer les répercussions de cette altération épigénétique sur la compartimentation et l'expression des gènes. Entre autres, ce projet a révélé des changements transcriptionnels concordants au niveau des TADs. De façon remarquable, les analyses menées à l'échelle des TADs ont conduit à la découverte d'un domaine réprimé comprenant des gènes suppresseurs de tumeurs co-régulés au sein duquel a également lieu un recâblage des interactions entre promoteurs. D'intérêt thérapeutique, un traitement avec un inhibiteur de EZH2 inverse les effets de la mutations.
Ces résultats m'ont incitée à explorer la co-régulation à l'intérieur des TADs de manière plus systématique en développant une méthode pour détecter les TADs qui sont activés ou réprimés entre deux conditions expérimentales. En l'appliquant sur des jeux de données de The Cancer Genome Atlas , une telle approche a le potentiel de mener à l'identification de modules fonctionnels impliqués dans la tumorigenèse. Plus généralement, cet algorithme pourrait renseigner dans quels contextes l'organisation en domaines de la chromatine est importante pour l'expression des gènes.
En conclusion, mes analyses soulignent les précautions méthodologiques à prendre lors du traite ment de données Hi-C, contribuent à une meilleure caractérisation de l'architecture de la chromatine dans le cancer et fournissent à la communauté une stratégie pour explorer la co-régulation à l'intérieur des TADs dans une large variété de processus biologiques.
Create date
13/09/2021 11:27
Last modification date
14/09/2021 5:40