Critical role of CTCF and Cp190 in Drosophila genome organization and gene regulation
Details
Download: thèse-AA-OK.pdf (47911.27 [Ko])
State: Public
Version: After imprimatur
License: Not specified
State: Public
Version: After imprimatur
License: Not specified
Serval ID
serval:BIB_CFE13B78295C
Type
PhD thesis: a PhD thesis.
Collection
Publications
Institution
Title
Critical role of CTCF and Cp190 in Drosophila genome organization and gene regulation
Director(s)
Gambetta Cristina
Codirector(s)
Gatfield David
Institution details
Université de Lausanne, Faculté de biologie et médecine
Publication state
Accepted
Issued date
2022
Language
english
Abstract
The eukaryotic genome is partitioned into contact domains (sometimes referred to as Topologically Associating Domains, or TADs). These domains are chromatin regions that interact in 3D more frequently within themselves than with nearby domains. A particular class of proteins known as insulator binding proteins (IBPs) bind at the boundaries of these domains. In mammals, CTCF - the only known IBP to date – forms contact domain boundaries by stalling loop-extruding cohesin. This mechanism explains why CTCF and cohesin binding is enriched at contact domain boundaries in mammals. Even though Drosophila also has CTCF, the role of CTCF in forming contact domain boundaries was debated because CTCF binding is not clearly enriched at fly contact domain boundaries.
In contrast to CTCF, another IBP called Cp190 was recently reported to bind to all contact domain boundaries. We examined the effects of complete absence of CTCF and Cp190, separately and in combination, on genome organization and gene regulation. We found that CTCF and Cp190 are both essential for fly viability, but Cp190 loss leads to much earlier lethality (embryonic lethality) than loss of CTCF (late pupal lethality). We found that CTCF binds to and is required to form a small subset of contact domain boundaries. Cp190 recruitment to CTCF-occupied boundaries was strictly CTCF-dependent at some boundaries, and at least partially CTCF-independent at other boundaries. CTCF and Cp190 coregulated the expression of a subset of genes present near CTCF and Cp190 co-occupied boundaries. In contrast to CTCF, we found that Cp190 is the major architectural protein in Drosophila as 25% of contact domain boundaries were affected by Cp190 loss (compared to only 10% of boundaries affected by CTCF loss). Although Cp190 binds to most contact domain boundaries, Cp190 was only required to form boundaries that are distal to (i.e. more than 200 bp from) a transcriptional start site (TSS) whereas Cp190 was dispensable to form the remaining 75% of boundaries that are all TSS-proximal. In addition to Cp190’s role in contact domain boundary formation, Cp190 also blocked regulatory crosstalk of tested developmental genes with nearby enhancers. However, Cp190 was dispensable for long-range enhancer-promoter communication at tested loci. This demonstrated that, in contrast to preconceived notions, Cp190 is not merely a “looping factor” organizing the fly genome into a series of loops that either connect or segregate gene promoters and enhancers.
Taken together, our results demonstrated that CTCF and Cp190 are critical factors required for genome organization and gene regulation. This revealed for the first time that diverse mechanisms exist to partition animal genomes into physical and regulatory domains. This advanced our fundamental understanding of the relevance of genome folding for gene regulation in Drosophila.
--
Le génome eucaryote est divisé en domaines de contact (parfois appelés domaines d'association topologique ou TAD). Ces domaines sont des régions de chromatine qui interagissent en 3D plus fréquemment en eux-mêmes qu'avec des domaines voisins. Une classe particulière de protéines, connues sous le nom de protéines de liaison isolantes (IBP) se lie aux limites de ces domaines. Chez les mammifères, CTCF – l’unique IBP connu à ce jour - forme les limites des domaines de contacts, en bloquant la cohésine durant l’extrusion de boucle d’ADN. Ce mécanisme explique pourquoi la liaison de CTCF et de la cohésine est enrichie aux limites des domaines de contacts, chez les mammifères. La drosophile possède également CTCF, mais son rôle dans la formation des limites des domaines de contacts est débattu. En effet, CTCF n'y est pas clairement enrichi.
Contrairement à CTCF, une autre IBP appelée Cp190 a récemment été signalé comme se liant à toutes les frontières des domaines de contacts. Nous avons examiné les effets de l'absence complète de CTCF et Cp190, séparément et en combinaison, sur l'organisation du génome et la régulation des gènes. Nous avons constaté que CTCF et Cp190 sont tous deux essentiels à la viabilité des drosophiles, mais que la perte de Cp190 entraîne une létalité beaucoup plus précoce (létalité embryonnaire) que la perte de CTCF (létalité pupale tardive). Nous avons constaté que CTCF est nécessaire pour former un petit sous-ensemble de frontières de domaines de contacts et qu’il se lie uniquement à ces frontières-là.
Le recrutement de CTCT aux frontières des domaines de contacts occupées par Cp190 est strictement dépendant du type de frontière : CTCF est requis à certaines frontières, et il est partiellement requis à d'autres frontières.
CTCF et Cp190 co-régule l'expression d'un sous-ensemble de gènes présents près des frontières des domaines de contacts qu’ils occupent ensemble. Contrairement à CTCF, nous avons constaté que Cp190 est la principale protéine architecturale chez la drosophile : En effet, 25 % des limites des domaines de contacts sont affectés par la perte de Cp190 alors que seulement 10 % des limites sont affectés par la perte de
CTCF. Bien que Cp190 se lie à la plupart des limites des domaines de contacts, Cp190 est nécessaire pour former des limites distales (c'est-à-dire à plus de 200 pb) d'un site de début de transcription (TSS) mais n’est pas essentiel pour former les 75% restants des limites des domaines de contacts qui sont toutes proche des TSS. En plus du rôle de Cp190 dans la formation des limites des domaines de contacts, Cp190 est également nécessaire pour bloquer les interactions indésirées entre des gènes de développement testés et des enhancers/amplificateur présent à proximité. Cependant, Cp190 est primordiale pour la communication entre amplificateur et promoteur séparé par de longue distance, aux loci testés. Démontrant que, contrairement aux idées préconçues, Cp190 n'est pas simplement un « facteur de boucle » organisant le génome de la drosophile en une série de boucles qui connectent ou séparent les promoteurs et les amplificateurs de gènes.
Pris ensemble, nos résultats démontre que CTCF et Cp190 sont des facteurs critiques nécessaires à l'organisation du génome et à la régulation des gènes. Cela met en lumière que pour la première fois, divers mécanismes existent pour partitionner les génomes animaux en différent domaines physiques très régulés. Nos découvertes mettent en lumière la pertinence de l’étude du repliement du génome pour la régulation des gènes chez la drosophile.
In contrast to CTCF, another IBP called Cp190 was recently reported to bind to all contact domain boundaries. We examined the effects of complete absence of CTCF and Cp190, separately and in combination, on genome organization and gene regulation. We found that CTCF and Cp190 are both essential for fly viability, but Cp190 loss leads to much earlier lethality (embryonic lethality) than loss of CTCF (late pupal lethality). We found that CTCF binds to and is required to form a small subset of contact domain boundaries. Cp190 recruitment to CTCF-occupied boundaries was strictly CTCF-dependent at some boundaries, and at least partially CTCF-independent at other boundaries. CTCF and Cp190 coregulated the expression of a subset of genes present near CTCF and Cp190 co-occupied boundaries. In contrast to CTCF, we found that Cp190 is the major architectural protein in Drosophila as 25% of contact domain boundaries were affected by Cp190 loss (compared to only 10% of boundaries affected by CTCF loss). Although Cp190 binds to most contact domain boundaries, Cp190 was only required to form boundaries that are distal to (i.e. more than 200 bp from) a transcriptional start site (TSS) whereas Cp190 was dispensable to form the remaining 75% of boundaries that are all TSS-proximal. In addition to Cp190’s role in contact domain boundary formation, Cp190 also blocked regulatory crosstalk of tested developmental genes with nearby enhancers. However, Cp190 was dispensable for long-range enhancer-promoter communication at tested loci. This demonstrated that, in contrast to preconceived notions, Cp190 is not merely a “looping factor” organizing the fly genome into a series of loops that either connect or segregate gene promoters and enhancers.
Taken together, our results demonstrated that CTCF and Cp190 are critical factors required for genome organization and gene regulation. This revealed for the first time that diverse mechanisms exist to partition animal genomes into physical and regulatory domains. This advanced our fundamental understanding of the relevance of genome folding for gene regulation in Drosophila.
--
Le génome eucaryote est divisé en domaines de contact (parfois appelés domaines d'association topologique ou TAD). Ces domaines sont des régions de chromatine qui interagissent en 3D plus fréquemment en eux-mêmes qu'avec des domaines voisins. Une classe particulière de protéines, connues sous le nom de protéines de liaison isolantes (IBP) se lie aux limites de ces domaines. Chez les mammifères, CTCF – l’unique IBP connu à ce jour - forme les limites des domaines de contacts, en bloquant la cohésine durant l’extrusion de boucle d’ADN. Ce mécanisme explique pourquoi la liaison de CTCF et de la cohésine est enrichie aux limites des domaines de contacts, chez les mammifères. La drosophile possède également CTCF, mais son rôle dans la formation des limites des domaines de contacts est débattu. En effet, CTCF n'y est pas clairement enrichi.
Contrairement à CTCF, une autre IBP appelée Cp190 a récemment été signalé comme se liant à toutes les frontières des domaines de contacts. Nous avons examiné les effets de l'absence complète de CTCF et Cp190, séparément et en combinaison, sur l'organisation du génome et la régulation des gènes. Nous avons constaté que CTCF et Cp190 sont tous deux essentiels à la viabilité des drosophiles, mais que la perte de Cp190 entraîne une létalité beaucoup plus précoce (létalité embryonnaire) que la perte de CTCF (létalité pupale tardive). Nous avons constaté que CTCF est nécessaire pour former un petit sous-ensemble de frontières de domaines de contacts et qu’il se lie uniquement à ces frontières-là.
Le recrutement de CTCT aux frontières des domaines de contacts occupées par Cp190 est strictement dépendant du type de frontière : CTCF est requis à certaines frontières, et il est partiellement requis à d'autres frontières.
CTCF et Cp190 co-régule l'expression d'un sous-ensemble de gènes présents près des frontières des domaines de contacts qu’ils occupent ensemble. Contrairement à CTCF, nous avons constaté que Cp190 est la principale protéine architecturale chez la drosophile : En effet, 25 % des limites des domaines de contacts sont affectés par la perte de Cp190 alors que seulement 10 % des limites sont affectés par la perte de
CTCF. Bien que Cp190 se lie à la plupart des limites des domaines de contacts, Cp190 est nécessaire pour former des limites distales (c'est-à-dire à plus de 200 pb) d'un site de début de transcription (TSS) mais n’est pas essentiel pour former les 75% restants des limites des domaines de contacts qui sont toutes proche des TSS. En plus du rôle de Cp190 dans la formation des limites des domaines de contacts, Cp190 est également nécessaire pour bloquer les interactions indésirées entre des gènes de développement testés et des enhancers/amplificateur présent à proximité. Cependant, Cp190 est primordiale pour la communication entre amplificateur et promoteur séparé par de longue distance, aux loci testés. Démontrant que, contrairement aux idées préconçues, Cp190 n'est pas simplement un « facteur de boucle » organisant le génome de la drosophile en une série de boucles qui connectent ou séparent les promoteurs et les amplificateurs de gènes.
Pris ensemble, nos résultats démontre que CTCF et Cp190 sont des facteurs critiques nécessaires à l'organisation du génome et à la régulation des gènes. Cela met en lumière que pour la première fois, divers mécanismes existent pour partitionner les génomes animaux en différent domaines physiques très régulés. Nos découvertes mettent en lumière la pertinence de l’étude du repliement du génome pour la régulation des gènes chez la drosophile.
Create date
31/10/2022 12:00
Last modification date
08/11/2022 11:20