Simplifying complex scRNA-seq data with metacells
Détails
ID Serval
serval:BIB_2401D262ADDA
Type
Thèse: thèse de doctorat.
Collection
Publications
Institution
Titre
Simplifying complex scRNA-seq data with metacells
Directeur⸱rice⸱s
Gfeller David
Détails de l'institution
Université de Lausanne, Faculté de biologie et médecine
Statut éditorial
Acceptée
Date de publication
2022
Langue
anglais
Résumé
Single-cell RNA sequencing (scRNA-seq) provides unique opportunities for studying heterogeneous cells populations. However, in-depth single-cell transcriptomic characterization often requires profiling tens to hundreds of thousands of cells. The rapid development of scRNA-seq technologies increases cell throughput while reducing sequencing costs. The consequent explosion of the scale of scRNA-seq datasets raises a computational burden for the analysis of such data. While algorithms and bioinformatics pipelines are being optimized to manage the large-scale data, the simplification of scRNA-seq data is yet poorly studied.
The first part of this thesis introduces a computational approach for the coarse-graining of scRNA-seq data by merging similar cells into metacells. Thorough benchmarking demonstrated that metacells not only preserve but often improve the results of the downstream analyses including visualization, clustering, differential expression analysis, cell type annotation, gene correlation, RNA velocity and data integration. By capitalizing on the redundancy inherent to scRNA-seq data, metacells significantly facilitate and accelerate the construction and interpretation of single-cell atlases.
The second part of the thesis presents an unbiased identification and transcriptome-wide characterization of tumor-infiltrating cytolytic CD4 T cells in different human cancers using published scRNA-seq datasets. Our computational analysis revealed a subpopulation of CD4 T cells that resembles CD8 T cells transcriptomic profiles and has similar cytolytic activity against tumors, as was validated experimentally.
Overall, this thesis presents a comprehensive framework for the simplification of scRNA-seq data and demonstrates the effectiveness of scRNA-seq data analysis for the characterization of poorly studied subtypes of tumor-infiltrating immune cells.
--
Le séquençage de l'ARN d'une seule cellule (scRNA-seq) offre des possibilités uniques d'étudier des populations cellulaires hétérogènes. Cependant, la caractérisation transcriptomique approfondie d'une cellule nécessite souvent le profilage de dizaines ou de centaines de milliers de cellules. Le développement rapide des technologies scRNA-seq a permis d’augmenter le débit cellulaire tout en réduisant les coûts de séquençage. Par conséquent, l'explosion de l'échelle des ensembles de données scRNA-seq entraîne une charge de calcul importante pour l'analyse de ces données. Bien que les algorithmes et les pipelines bioinformatiques sont optimisés pour gérer cette charge de calcul, la simplification des données scRNA-seq est encore peu étudiée.
La première partie de la thèse présente une approche computationnelle pour la simplification des données scRNA-seq en fusionnant des cellules aux profiles similaires dans des métacells. Une analyse comparative exhaustive a démontré que les métacells non seulement préservent mais améliorent souvent les résultats d’analyses telles que la visualisation, le partitionnement de données, l'analyse de l'expression différentielle, l'annotation du type de cellule, la corrélation des gènes, la vélocité de l'ARN et l'intégration des données. En tirant parti de la redondance inhérente aux données scRNA-seq, les métacells facilitent et accélèrent considérablement la construction et l'interprétation des atlas unicellulaires.
La deuxième partie de la thèse présente une identification non biaisée et une caractérisation transcriptomique de cellules T CD4 cytolytiques infiltrant différents types de tumeurs à partir d’un ensemble de jeu de données scRNA-seq. Notre analyse computationnelle a révélé une sous-population de cellules T CD4 qui possède un profil transcriptomique et une activité cytolytique contre les tumeurs semblables à ceux des cellules T CD8, ce qui a été validé expérimentalement.
Dans l'ensemble, cette thèse présente un framework complet pour la simplification des données scRNA-seq et démontre l'application de l'analyse des données scRNA-seq pour la caractérisation de sous-types peu étudiés de cellules immunitaires infiltrant les tumeurs.
The first part of this thesis introduces a computational approach for the coarse-graining of scRNA-seq data by merging similar cells into metacells. Thorough benchmarking demonstrated that metacells not only preserve but often improve the results of the downstream analyses including visualization, clustering, differential expression analysis, cell type annotation, gene correlation, RNA velocity and data integration. By capitalizing on the redundancy inherent to scRNA-seq data, metacells significantly facilitate and accelerate the construction and interpretation of single-cell atlases.
The second part of the thesis presents an unbiased identification and transcriptome-wide characterization of tumor-infiltrating cytolytic CD4 T cells in different human cancers using published scRNA-seq datasets. Our computational analysis revealed a subpopulation of CD4 T cells that resembles CD8 T cells transcriptomic profiles and has similar cytolytic activity against tumors, as was validated experimentally.
Overall, this thesis presents a comprehensive framework for the simplification of scRNA-seq data and demonstrates the effectiveness of scRNA-seq data analysis for the characterization of poorly studied subtypes of tumor-infiltrating immune cells.
--
Le séquençage de l'ARN d'une seule cellule (scRNA-seq) offre des possibilités uniques d'étudier des populations cellulaires hétérogènes. Cependant, la caractérisation transcriptomique approfondie d'une cellule nécessite souvent le profilage de dizaines ou de centaines de milliers de cellules. Le développement rapide des technologies scRNA-seq a permis d’augmenter le débit cellulaire tout en réduisant les coûts de séquençage. Par conséquent, l'explosion de l'échelle des ensembles de données scRNA-seq entraîne une charge de calcul importante pour l'analyse de ces données. Bien que les algorithmes et les pipelines bioinformatiques sont optimisés pour gérer cette charge de calcul, la simplification des données scRNA-seq est encore peu étudiée.
La première partie de la thèse présente une approche computationnelle pour la simplification des données scRNA-seq en fusionnant des cellules aux profiles similaires dans des métacells. Une analyse comparative exhaustive a démontré que les métacells non seulement préservent mais améliorent souvent les résultats d’analyses telles que la visualisation, le partitionnement de données, l'analyse de l'expression différentielle, l'annotation du type de cellule, la corrélation des gènes, la vélocité de l'ARN et l'intégration des données. En tirant parti de la redondance inhérente aux données scRNA-seq, les métacells facilitent et accélèrent considérablement la construction et l'interprétation des atlas unicellulaires.
La deuxième partie de la thèse présente une identification non biaisée et une caractérisation transcriptomique de cellules T CD4 cytolytiques infiltrant différents types de tumeurs à partir d’un ensemble de jeu de données scRNA-seq. Notre analyse computationnelle a révélé une sous-population de cellules T CD4 qui possède un profil transcriptomique et une activité cytolytique contre les tumeurs semblables à ceux des cellules T CD8, ce qui a été validé expérimentalement.
Dans l'ensemble, cette thèse présente un framework complet pour la simplification des données scRNA-seq et démontre l'application de l'analyse des données scRNA-seq pour la caractérisation de sous-types peu étudiés de cellules immunitaires infiltrant les tumeurs.
Création de la notice
07/09/2022 11:12
Dernière modification de la notice
01/12/2022 9:32