单细胞和空间多组学方法及其应用

亦民评健康 2024-06-27 13:58:24

2023年3月,《Nature Reviews Genetics 》发表了一篇综述文章,重点介绍了快速发展的单细胞和空间多组学技术(也称为多模式组学方法)领域的进展,以及跨这些分子层整合信息所需的计算策略。同时还展示了它们对基础细胞生物学和转化研究的影响。

单细胞和空间多模式方法的时间线

单细胞多组学方法

来自单细胞的多组分测量可以通过不同的方法进行,这些方法可以根据不同的分子分析物在测序文库制备之前、期间或之后是否解偶联来分类。

单细胞多组测量的四个一般原则

原则1基于不同分子分析物(a、b 部分)的物理分离。

原则2称为预放大和拆分,不同的分析物被差异标记并联合预放大,然后拆分预放大反应以制备分析物特异性测序文库。

原则3称为 seq-split。

原则4称为组合索引,单细胞的分子分析物被标记而不分离单细胞。

单细胞基因组+转录组

scDNA-seq和scRNA-seq方案建立后不久,就开发出了对单个细胞进行基因组加转录组测序的方法,例如G&T-seq、SIDR-seq、 DR-seq、scONE-seq、sci-L3-RNA/DNA等。

单细胞基因组学+转录组学方法

对同一细胞的基因组和转录组的研究能够明确地研究获得性DNA突变对同一个细胞中基因表达的影响。这对于理解肿瘤内异质性具有重要的应用,可以研究不同遗传亚克隆之间,甚至单个遗传亚克隆内不同表型癌症细胞状态的发展,例如在儿科急性淋巴细胞白血病中,DNTR-seq鉴定了具有遗传拷贝数改变和相关转录干扰的微小亚克隆;在治疗前和治疗期间对患者肿瘤样本进行直接纵向采样,并通过单细胞基因组加转录组测序对其进行分析,将有助于研究哪些基因亚克隆更适合耐受药物选择等。

除了肿瘤学领域,这些多组学方法对于理解其他疾病的发病机制也很重要。在这些疾病中,体细胞遗传变异起着推定的作用,包括阿尔茨海默病、帕金森病等神经系统疾病。随着最近发现正常组织也会发生异常数量的突变,能够分析同一单个细胞的基因组和转录组的技术对于研究获得性突变对表型和功能细胞状态的作用或影响非常重要,以及这些又如何影响发育、正常细胞和遗传异常细胞之间的细胞竞争、组织稳态、正常表型变异和衰老。例如使用DNTR-seq表明,结构DNA失衡会导致线性和非线性转录剂量效应,其中有几个对癌细胞生长很重要的基因。

此外,单细胞基因组加转录组测序也是研究种系治疗中基因组编辑有效性和安全性的有价值的工具;基因组加转录组测序方法允许在DNA序列中检测到的遗传变异在同一细胞的RNA序列中得到证实,从而提高了基因分型的可靠性。

单细胞表观基因组+转录组

大多数已知的表观遗传信息层,包括DNA甲基化、染色质可及性、组蛋白修饰、转录因子(TF)的结合和染色质重塑复合物,可以从与转录组平行的单细胞中回收。这种方法很多,但在灵敏度、特异性和易用性方面各不相同。

选择基于标记的单细胞多组分析方法

选择基于DNA甲基化的单细胞多组学分析方法

尽管单细胞表观基因组+转录组是一项具有挑战性的技术,但所得数据的多组学性质能够对细胞进行非常深入的分析,揭示表观基因组和转录组在发育、分化或发病过程中的变化层次。例如,使用scNMT-seq揭示小鼠原肠胚形成的阶段。

单细胞组学+另一种分析物的低复杂度分析

最近在对单个分析物的单个细胞进行综合分析和对另一种分析物以不太全面(低复杂度)的方式进行分析方面取得了实质性进展。这些方法中最常见的是量化细胞的转录组和/或可及的基因组,以及一组有限的细胞表面或核内蛋白质。这些方法通常依赖于标记有特定条形码寡核苷酸的抗体,这些寡核苷酸可以与转录组一起被捕获和扩增。除了基因表达或其他模式之外,此类方法还可以分析蛋白质丰度。

空间多组学方法

空间多组学方法正在迅速发展,以允许在其天然组织背景下以亚细胞分辨率研究不同的分子分析物,通常空间组学测量还辅以相同或相邻组织切片的组织学染色,如H&E(苏木精和伊红)染色,从而与额外的形态学注释相结合。

空间ATAC&RNA-seq 和空间CUT&Tag-RNA-seq 分别描述了在同一组织冷冻切片上同时无偏分析染色质可及性或特定组蛋白修饰和基因表达的可能性;或者,基于显微镜的方法可以通过以高达亚细胞分辨率直接成像单细胞内的DNA位点、染色体和核结构以及转录物,实现基因组或表观基因组信息以及基因表达的空间分析;目前,允许对转录组和蛋白质组进行平行空间询问的方法仍然有限,通常基于两种模式的系列表征,大多只允许对有限数量的蛋白质进行共同表征,并且通常缺乏单细胞分辨率。

空间多组学方法

数据整合

多组学数据整合的主要目标是实现稳健且灵敏的细胞类型或细胞状态识别。这种细胞身份的综合多组学观点可以提高对分化轨迹、其潜在基因调控网络、细胞间相互作用、微环境空间组织、细胞谱系和克隆动力学的理解。最终,细胞身份的整体观点解开了不同分子层之间的因果关系,从而产生了观察到的细胞表型。然而,为了实现高维数据模式的有意义的整合,需要开发考虑这些技术的技术和生物复杂性的计算和统计模型。

最近一项研究根据用于连接不同数据模式的锚点,定义了三类数据整合策略:水平整合策略使用在不同数据集上测量的共同数据特征来整合独立分析的细胞组,例如当用相同的技术分析不同批次时,或者当跨不同的技术整合测量相同的分子分析物时。相反,垂直整合策略使用细胞作为锚定单元来整合不重叠的数据特征,例如当并行测量相同细胞的多个组学层时。当单细胞和公共数据特征都不能用作锚点时,最困难的整合问题就会出现。在这种情况下,对角线整合策略用于绘制通过不同分子测定分析的不同细胞组的图谱。

数据整合策略

尽管进行了广泛的研究,但计算数据整合仍面临一些挑战。这些策略对在不同实验和/或模式中捕获的细胞状态的预期相似性做出了隐含的假设。在不同批次水平数据整合的情况下,这可能会导致真实生物变异的过度校正,尤其是在研究不同实验条件下细胞状态的细微变化时。当特征之间的对应关系不是立即明显时和/或当不同层之间的非线性可能与生物学相关时,垂直整合策略会进一步加剧这一问题。因此,需要开发整合方法,该方法不仅可以识别不同样品和/或分子层之间的共同锚,而且可以以易于解释的方式说明样品特异性和模态特异性的变化。此类模型已在多领域学习的其他领域提出,但尚未适用于细胞多组学数据集。扩展这些模型以整合成对、未成对和多模态空间分析将需要强大的数据标准来对多模态数据进行可扩展分析,此外还需要完善的基准来评估它们的功效。

在未来的几十年里,单细胞和空间分辨率的多组学将进一步创新,从而对细胞生物学有更全面的了解。可以预期在多个方面取得进展,包括通量的提高、成本的降低以及在单一检测中纳入更多模式。

作为多组学测量的一部分,我们期望在检测和表征每种模式时提高灵敏度和特异性。例如,在基因组水平上,对所有遗传变异进行完整且无错误的表征仍然是一个挑战,目前这限制了以单细胞分辨率进行全面体细胞突变分析和从自然获得的突变中重建系统发育细胞谱系的机会。同样,表观基因组的测量在共同检测共同调节基因表达和其他DNA相关过程的表观基因组特征范围方面受到严重限制。例如组蛋白PTM目前一次只能检测一个或几个标记;因此,这些方法将受益于可共同检测的PTM数量的急剧增加,以及其他表观基因组特征。转录组的表征通常仅限于poly(A) RNA而不是总RNA测量;因此,包括编码和(小)非编码 RNA 以及并发亚型检测将是有益的。蛋白质组分析仍然是基于抗体的,因此在可以同时分析多少蛋白质方面受到限制。无偏的低输入方法,如基于质谱的方法可能会规避这一点,但目前不能与其他分子层的检测相结合。这种多模态整合的缺乏也适用于代谢组学和脂质组学分析。

除了在多组学方法中表征模态的此类改进外,我们还期待开发多模态分析,这些分析包含目前仍未知的全新模态,例如表观转录组。该领域还可能会看到对空间多组学的持续强劲技术推动,避免组织解离的需要,并能够同时对定义细胞类型和状态的细胞内在和外在分子特征进行多组学分析。此外,将自然获得或人工诱导的DNA突变重建的系统发育细胞谱系与其他空间或单细胞多基因组信息相结合,将改变我们对健康和疾病中的有机体发育、细胞迁移途径和干细胞生物学的理解。最后,有必要开发不仅捕获瞬时表型而且捕获祖先状态的方法,将多组学技术应用于活细胞的连续测量,并通过计算提高从每个分子层提取数据的准确性,以及进行综合分析。跨模式分析以揭示不同数据源内部和之间的依赖关系。

参考文献

Vandereyken, K., Sifrim, A., Thienpont, B. et al. Methods and applications for single-cell and spatial multi-omics. Nat Rev Genet (2023). https://doi.org/10.1038/s41576-023-00580-2.

0 阅读:0

亦民评健康

简介:感谢大家的关注