Unbiased screening of DNA factors important for gene insulation
Details
Serval ID
serval:BIB_ADA90B6A9C8D
Type
PhD thesis: a PhD thesis.
Collection
Publications
Institution
Title
Unbiased screening of DNA factors important for gene insulation
Director(s)
Gambetta Maria Cristina
Codirector(s)
Roignant Jean-Yves
Institution details
Université de Lausanne, Faculté de biologie et médecine
Publication state
Accepted
Issued date
2024
Language
english
Abstract
ln genomes of multicellular eukaryotes, cell- and tissue specificity arise as a result of complex gene regulatory networks. Regulatory elements, such as enhancers and silencers, are separated from their target gene promoters, and require establishment of long-range contacts through formation of chromatin loops. However, regulatory elements may be in proximity to other, non-target genes, either in their endogenous locus or in the loci they contact. Therefore, a mechanism to prevent regulatory miscommunication has evolved. lnsulators prevent regulatory crosstalk by blocking regulatory elements from interacting with non-target promoters. lnsulators are DNA sequences bound by a specific class of proteins - insulator-binding proteins. One insulator binding protein, CTCF, is evolutionary conserved and is in common in flies and mammals. Unlike enhancers, silencer and promoters, that have been extensively studied in a wide range of model organisms and with several approaches, insulators remain an understudied class of regulatory elements, despite being important for development and human health. ln my thesis project, 1 aimed to expand our knowledge about insulators by developing and performing the first unbiased screen for insulators in any genome and systematically testing what in the DNA sequence encodes insulators in Drosophila.
During my thesis, 1 developed an approach we called insulator-seq. The method is based on an insulator reporter. The high throughput cloning allows to create a library of millions of reporters, each carrying a unique test fragment. After the library of insulator-seq reporters is transiently transfected in cultured Drosophila cells, the reporter genes are expressed with barcodes unique to each reporter. The barcodes are counted by RNA-seq and the insulator strength of each of the test fragment is determined as the ratio of two reporter genes. With insulator-seq, 1 screened two 400-kb loci in the Drosophila genome and calculated insulator score for hundreds of thousands of test fragments. 1 discovered novel insulators and confirmed that some of them are functional in vivo. Ali the discovered insulators are insulator binding protein sites, but not all insulator binding sites actas insulators in the assay.
To determine what in the DNA sequence is encoding insulation and why the presence of an insulator-binding protein site is not sufficient for insulation, 1 have systematically mutagenized the sequences of CTCF-dependent insulators, and measured effects of the mutagenesis on insulation with insulator-seq. We discovered that both the presence of an insulator-binding protein motif and permissive genomic context around the motif are required and equally important for insulation.
Together, the results of my thesis established a high throughput screening technique that can be used to discover more novel insulators, reported new functional insulators in Drosophila, and expanded our knowledge about insulator DNA sequence determinants.
--
Dans les génomes eucaryotes multicellulaires, les spécificités cellulaires et tissulaires résultent de réseaux complexes de régulation des gènes. Les éléments régulateurs, tels que les activateurs et les répresseurs, sont séparés de leurs promoteurs cibles et nécessitent la formation de boucles de chromatine pour établir des contacts à longue distance. Cependant, ces éléments peuvent se trouver près d'autres gènes non-cibles. Un mécanisme existe pour empêcher cette mauvaise régulation génique. Les protéines isolatrices bloquent les interactions non ciblées entre gènes et activateurs en se liant à des séquences d'ADN spécifiques, appelées sites de liaisons aux protéines isolatrices. Une de ces protéines isolatrices, appelé CTCF, est cruciale pour le développement et de ce fait, est conservée chez de très nombreuses espèces incluant l'Homme et la Drosophile. Contrairement aux activateurs, répresseurs et promoteurs, largement étudiés, les isolateurs restent peu explorés malgré leur importance pour la santé humaine.
Dans mon projet de thèse, j'ai cherché à mieux comprendre les isolateurs en développant et en réalisant le premier criblage impartial des isolateurs dans un génome, en testant systématiquement les séquences d'ADN codant les isolateurs chez la drosophile.
J'ai mis au point une méthode appelée "insulator-seq". Cette méthode permet de mesurer la force d'isolation d'un fragment d'ADN test. Le clonage à haut débit permet de créer des millions de rapporteurs avec des fragments tests uniques. Lorsque ces rapporteurs sont transfectés dans des cellules de drosophile, ils sont transcrits avec les code-barres uniques. Ces code-barres sont ensuite comptés par RNA-seq et la force d'isolation de chaque fragment est testé est déterminée par le ratio du nombre de lectures des fragments rapporteurs. Avec la méthode insulator-seq, j'ai criblé deux loci de 400 kb dans le génome de la drosophile et calculé la force d'isolation pour des centaines de milliers de fragments de test. J'ai découvert de nouveaux isolateurs et confirmé que certains d'entre eux sont fonctionnels in vivo. Tous les isolateurs sont des sites de liaisons aux protéines isolatrices mais tous les sites ne fonctionnent pas comme des isolateurs dans notre test.
Pour comprendre ce qui encode l'isolation et pourquoi la simple présence d'un site de liaison aux protéines isolatrices est insuffisante, j'ai systématiquement muté les séquences des isolateurs dépendants de CTCF et mesuré les effets de ces mutations sur l'isolation avec l'insulator-seq. J'ai découvert que la présence d'un motif de liaison et qu'un contexte génomique permissif autour du motif sont tous deux nécessaires pour l'isolation.
Ensemble, les résultats de ma thèse ont conduit à une technique de criblage à haut débit qui peut être utilisée pour découvrir de nouveaux isolateurs. Mes résultats ont permis la découverte de nouveaux isolateurs fonctionnels chez la drosophile et ont élargi nos connaissances sur les dénominateurs déterminants d'une séquence isolatrice d'ADN
During my thesis, 1 developed an approach we called insulator-seq. The method is based on an insulator reporter. The high throughput cloning allows to create a library of millions of reporters, each carrying a unique test fragment. After the library of insulator-seq reporters is transiently transfected in cultured Drosophila cells, the reporter genes are expressed with barcodes unique to each reporter. The barcodes are counted by RNA-seq and the insulator strength of each of the test fragment is determined as the ratio of two reporter genes. With insulator-seq, 1 screened two 400-kb loci in the Drosophila genome and calculated insulator score for hundreds of thousands of test fragments. 1 discovered novel insulators and confirmed that some of them are functional in vivo. Ali the discovered insulators are insulator binding protein sites, but not all insulator binding sites actas insulators in the assay.
To determine what in the DNA sequence is encoding insulation and why the presence of an insulator-binding protein site is not sufficient for insulation, 1 have systematically mutagenized the sequences of CTCF-dependent insulators, and measured effects of the mutagenesis on insulation with insulator-seq. We discovered that both the presence of an insulator-binding protein motif and permissive genomic context around the motif are required and equally important for insulation.
Together, the results of my thesis established a high throughput screening technique that can be used to discover more novel insulators, reported new functional insulators in Drosophila, and expanded our knowledge about insulator DNA sequence determinants.
--
Dans les génomes eucaryotes multicellulaires, les spécificités cellulaires et tissulaires résultent de réseaux complexes de régulation des gènes. Les éléments régulateurs, tels que les activateurs et les répresseurs, sont séparés de leurs promoteurs cibles et nécessitent la formation de boucles de chromatine pour établir des contacts à longue distance. Cependant, ces éléments peuvent se trouver près d'autres gènes non-cibles. Un mécanisme existe pour empêcher cette mauvaise régulation génique. Les protéines isolatrices bloquent les interactions non ciblées entre gènes et activateurs en se liant à des séquences d'ADN spécifiques, appelées sites de liaisons aux protéines isolatrices. Une de ces protéines isolatrices, appelé CTCF, est cruciale pour le développement et de ce fait, est conservée chez de très nombreuses espèces incluant l'Homme et la Drosophile. Contrairement aux activateurs, répresseurs et promoteurs, largement étudiés, les isolateurs restent peu explorés malgré leur importance pour la santé humaine.
Dans mon projet de thèse, j'ai cherché à mieux comprendre les isolateurs en développant et en réalisant le premier criblage impartial des isolateurs dans un génome, en testant systématiquement les séquences d'ADN codant les isolateurs chez la drosophile.
J'ai mis au point une méthode appelée "insulator-seq". Cette méthode permet de mesurer la force d'isolation d'un fragment d'ADN test. Le clonage à haut débit permet de créer des millions de rapporteurs avec des fragments tests uniques. Lorsque ces rapporteurs sont transfectés dans des cellules de drosophile, ils sont transcrits avec les code-barres uniques. Ces code-barres sont ensuite comptés par RNA-seq et la force d'isolation de chaque fragment est testé est déterminée par le ratio du nombre de lectures des fragments rapporteurs. Avec la méthode insulator-seq, j'ai criblé deux loci de 400 kb dans le génome de la drosophile et calculé la force d'isolation pour des centaines de milliers de fragments de test. J'ai découvert de nouveaux isolateurs et confirmé que certains d'entre eux sont fonctionnels in vivo. Tous les isolateurs sont des sites de liaisons aux protéines isolatrices mais tous les sites ne fonctionnent pas comme des isolateurs dans notre test.
Pour comprendre ce qui encode l'isolation et pourquoi la simple présence d'un site de liaison aux protéines isolatrices est insuffisante, j'ai systématiquement muté les séquences des isolateurs dépendants de CTCF et mesuré les effets de ces mutations sur l'isolation avec l'insulator-seq. J'ai découvert que la présence d'un motif de liaison et qu'un contexte génomique permissif autour du motif sont tous deux nécessaires pour l'isolation.
Ensemble, les résultats de ma thèse ont conduit à une technique de criblage à haut débit qui peut être utilisée pour découvrir de nouveaux isolateurs. Mes résultats ont permis la découverte de nouveaux isolateurs fonctionnels chez la drosophile et ont élargi nos connaissances sur les dénominateurs déterminants d'une séquence isolatrice d'ADN
Create date
06/11/2024 12:15
Last modification date
07/11/2024 7:31