Genomic organisation, gene expression and antisense transcription in a chromosomal region of Leishmania major
Details
Serval ID
serval:BIB_42160
Type
PhD thesis: a PhD thesis.
Collection
Publications
Institution
Title
Genomic organisation, gene expression and antisense transcription in a chromosomal region of Leishmania major
Director(s)
Fasel N.
Institution details
Université de Lausanne, Faculté de biologie et médecine
Address
Lausanne
Publication state
Accepted
Issued date
2004
Language
english
Number of pages
77
Notes
REROID:R003641957; 30 cm ill.; Old school value: Université de Lausanne
Abstract
Abstract
Leishmania is a parasitic protozoan responsible for leishmaniasis, a disease causing widespread suffering and death.
Little is known about the relation between the genome organisation and gene expression in Leishmania. Bioinformatic analyses are used to predict genes and find homologies with known proteins. In the current accepted model, genes are organised into large clusters and transcribed from only one strand, in the form of large polycistronic primary transcripts. To verify the validity of this model, we studied gene expression at the transcriptional, post-transcriptional and translational levels in a unique locus of 34 kb located on chr27 and represented by cosmid L979. Sequence analysis revealed 115 open reading frames (ORFs) on either DNA strand. Using computer programs trained to identify Leishmania genes, only nine of these ORFs were predicted to code for proteins, some of which showed homologies with known proteins. Additionally, one pseudogene was identified. In agreement with the model, all predicted genes are localised on the same strand ("top" strand). We verified the biological relevance of these predictions. mRNAs from nine predicted ORFs and proteins from seven were detected. Nuclear run-on analyses confirmed that the top strand is transcribed by RNA polymerase II and suggested that there is no polymerase entry site. Low levels of transcription were detected in regions of the bottom strand and stable transcripts were identified for four ORFs on this strand not predicted to be protein- coding, including antisense transcripts to the Leishmania histone H1 genes, HIS-1.1 and HIS-1,2. These antis ense ORFs are located downstream of an adenine and thymine-rich (A/T-rich) sequence. Transcription was not affected when anti-HIS-1.2 was replaced with the coding region of the neomycin phosphotransferase gene, showing that the regulatory elements controlling antisense transcription are located outside of the gene. ORF129 was identified on the "bottom" strand, it is localised downstream of an A/T-rich sequence. It is transcribed only in the amastigote stage of the parasite.
In conclusion, the transcriptional organisation of the Leishmania genome is complex. Gene expression in Leishmania is not only regulated polycistronically from the sense strand of genomic DNA, but transcription can occur from both DNA strands, raising the possibility that computer predictions may not be comprehensive. These findings suggest that the parasite has evolved in such a way to maximise the transcription of its genome, a mechanism that might be important to maintain its virulence.
Résumé
Leishmania est un parasite protozoaire responsable de la leishmaniose, maladie largement répandue en zones tropicale et subtropicale, pouvant provoquer la mort.
L'organisation du génome, ainsi que les mécanismes de régulation de l'expression des gènes sont encore très mal connus chez Leishmania. Toutefois, des analyses bioinformatiques de la séquence permettent de prédire les gènes et de trouver des homologies avec des protéines connues. Selon le modèle généralement accepté, les gènes sont regroupés en longues unités polycistroniques et transcrits à partir d'un seul brin sous forme d'un long transcrit primaire. Afin de vérifier la validité de ce modèle, nous avons étudié l'expression des gènes au niveau transcriptionnel, post-transcriptionnel et traductionnel dans un locus unique de 34 kb, situé sur le chromosome 27 et représenté par le cosmide L979. L'analyse de la séquence a révélé 115 cadres de lecture ouverts (ORFs) sur les deux brins de l'ADN. Seuls neufs d'entre eux sont prédits comme étant codant par les programmes informatiques spécifiques à Leishmania. En sus, un pseudogène a été identifié. En accord avec le modèle, tous les gènes prédits sont situés sur le même brin (le brin "codant"). La pertinence de ces prédictions a été vérifiée, l'ARNm de neuf gènes prédits, ainsi que sept protéines ont été detectés. Des expériences de "nuclear mn-on" ont confirmé que le brin codant est transcrit par des ARN polymérases II, toutefois, leur site n'entrée ne se trouve pas dans la séquence analysée. En ce qui concerne le brin "non-codant", certaines régions sont faiblement transcrites, et des transcrits stables ont été identifiés pour 4 ORFs de ce brin. Il s'agit entre autre des transcrits antisens des gènes codant pour l'histone H1 de Leishmania, HIS-1.1 et HIS-1.2. Ces ORFs sont localisés en aval d'une séquence riche en adénine et en thymine (A/T). En remplaçant HIS-1.2 par le gène de la néomycine phosphotransférase, la transcription n'est pas affectée, démontrant que les éléments régulant la transcription antisens sont localisés hors du gène. L'"ORF129", localisé sur le brin non codant et précédé d'une séquence riche en A/T, n'est transcrit qu'au stade amastigote.
En conclusion, l'organisation transcriptionnelle du génome de Leishmania est complexe, l'expression des gènes n'est pas uniquement régulée de manière polycistronique à partir d'un seul brin d'ADN, mais les deux brins sont transcrits, menant à la conclusion que les prédictions informatiques ne sont peut-être pas exhaustives. Le parasite semble avoir évolué de manière à maximiser la transcription de son génome, un mécanisme qui pourrait s'être avéré important pour le maintien de sa virulence.
Leishmania is a parasitic protozoan responsible for leishmaniasis, a disease causing widespread suffering and death.
Little is known about the relation between the genome organisation and gene expression in Leishmania. Bioinformatic analyses are used to predict genes and find homologies with known proteins. In the current accepted model, genes are organised into large clusters and transcribed from only one strand, in the form of large polycistronic primary transcripts. To verify the validity of this model, we studied gene expression at the transcriptional, post-transcriptional and translational levels in a unique locus of 34 kb located on chr27 and represented by cosmid L979. Sequence analysis revealed 115 open reading frames (ORFs) on either DNA strand. Using computer programs trained to identify Leishmania genes, only nine of these ORFs were predicted to code for proteins, some of which showed homologies with known proteins. Additionally, one pseudogene was identified. In agreement with the model, all predicted genes are localised on the same strand ("top" strand). We verified the biological relevance of these predictions. mRNAs from nine predicted ORFs and proteins from seven were detected. Nuclear run-on analyses confirmed that the top strand is transcribed by RNA polymerase II and suggested that there is no polymerase entry site. Low levels of transcription were detected in regions of the bottom strand and stable transcripts were identified for four ORFs on this strand not predicted to be protein- coding, including antisense transcripts to the Leishmania histone H1 genes, HIS-1.1 and HIS-1,2. These antis ense ORFs are located downstream of an adenine and thymine-rich (A/T-rich) sequence. Transcription was not affected when anti-HIS-1.2 was replaced with the coding region of the neomycin phosphotransferase gene, showing that the regulatory elements controlling antisense transcription are located outside of the gene. ORF129 was identified on the "bottom" strand, it is localised downstream of an A/T-rich sequence. It is transcribed only in the amastigote stage of the parasite.
In conclusion, the transcriptional organisation of the Leishmania genome is complex. Gene expression in Leishmania is not only regulated polycistronically from the sense strand of genomic DNA, but transcription can occur from both DNA strands, raising the possibility that computer predictions may not be comprehensive. These findings suggest that the parasite has evolved in such a way to maximise the transcription of its genome, a mechanism that might be important to maintain its virulence.
Résumé
Leishmania est un parasite protozoaire responsable de la leishmaniose, maladie largement répandue en zones tropicale et subtropicale, pouvant provoquer la mort.
L'organisation du génome, ainsi que les mécanismes de régulation de l'expression des gènes sont encore très mal connus chez Leishmania. Toutefois, des analyses bioinformatiques de la séquence permettent de prédire les gènes et de trouver des homologies avec des protéines connues. Selon le modèle généralement accepté, les gènes sont regroupés en longues unités polycistroniques et transcrits à partir d'un seul brin sous forme d'un long transcrit primaire. Afin de vérifier la validité de ce modèle, nous avons étudié l'expression des gènes au niveau transcriptionnel, post-transcriptionnel et traductionnel dans un locus unique de 34 kb, situé sur le chromosome 27 et représenté par le cosmide L979. L'analyse de la séquence a révélé 115 cadres de lecture ouverts (ORFs) sur les deux brins de l'ADN. Seuls neufs d'entre eux sont prédits comme étant codant par les programmes informatiques spécifiques à Leishmania. En sus, un pseudogène a été identifié. En accord avec le modèle, tous les gènes prédits sont situés sur le même brin (le brin "codant"). La pertinence de ces prédictions a été vérifiée, l'ARNm de neuf gènes prédits, ainsi que sept protéines ont été detectés. Des expériences de "nuclear mn-on" ont confirmé que le brin codant est transcrit par des ARN polymérases II, toutefois, leur site n'entrée ne se trouve pas dans la séquence analysée. En ce qui concerne le brin "non-codant", certaines régions sont faiblement transcrites, et des transcrits stables ont été identifiés pour 4 ORFs de ce brin. Il s'agit entre autre des transcrits antisens des gènes codant pour l'histone H1 de Leishmania, HIS-1.1 et HIS-1.2. Ces ORFs sont localisés en aval d'une séquence riche en adénine et en thymine (A/T). En remplaçant HIS-1.2 par le gène de la néomycine phosphotransférase, la transcription n'est pas affectée, démontrant que les éléments régulant la transcription antisens sont localisés hors du gène. L'"ORF129", localisé sur le brin non codant et précédé d'une séquence riche en A/T, n'est transcrit qu'au stade amastigote.
En conclusion, l'organisation transcriptionnelle du génome de Leishmania est complexe, l'expression des gènes n'est pas uniquement régulée de manière polycistronique à partir d'un seul brin d'ADN, mais les deux brins sont transcrits, menant à la conclusion que les prédictions informatiques ne sont peut-être pas exhaustives. Le parasite semble avoir évolué de manière à maximiser la transcription de son génome, un mécanisme qui pourrait s'être avéré important pour le maintien de sa virulence.
OAI-PMH
Create date
19/11/2007 12:37
Last modification date
29/06/2021 10:15