引言
在真核细胞中有多种通过RNA和蛋白质相分离形成的无膜结构细胞器。它们在各种重要的生物过程, 包括核糖核蛋白复合物(ribonucleoprotein complex)的合成与组装,基因表达,信号传导,以及细胞应激反应中发挥着关键作用。核斑体(Nuclear speckles)是位于高等真核细胞核内的一种无膜结构细胞器,它富含参与mRNA剪接调控的蛋白因子和小核核糖核酸(snRNA),如U1、U2等,调控着共转录剪切过程。长期以来,核斑体被认为对mRNA剪接起到调控作用。然而,关于核斑体是否参与所有基因的剪切、哪些基因的剪切受其调控、以及核斑体如何识别并调控这些基因等基本问题,目前尚无明确答案。来自芝加哥大学的费静怡课题组和纽约大学的Oded Regev研究团队合作,于2024年10月16日在Science Advances杂志上发表了题为Dynamic of RNA localization to nuclear speckles are connected to splicing efficiency 的研究。作者利用ARTR-seq技术和成像技术定位了核斑体内的转录组;通过生化手段揭示了核斑体对于不同基因的剪切调控作用;并通过生信分析和建模方法揭示了和核斑体定位相关联的RNA序列特征。作者首先利用了芝加哥大学何川组近期研发的用于检测与RNA结合蛋白相互作用的RNA测序方法——ARTR-seq (reverse transcription–based RNA binding protein binding sites sequencing)。该方法基于原位逆转录,利用核斑体的标志蛋白SON的抗体富集逆转录酶,从而对核斑体内的RNA进行测序。通过将测序结果与未使用一抗的对照组比较,计算出代表每个基因转录本在核斑体富集程度的指数,INSE。作者采用RNA原位杂交成像(FISH)技术验证了ARTR-seq可以定量反映RNA在核斑体内和整个细胞内的浓度比例。此外,通过标定不同核斑体标志蛋白SON与SRRM2得到的INSE值表现出高度一致性,进一步验证了该方法的可靠性。
作者发现与PolyA RNA以及细胞核RNA相比,核斑体富集的转录本包含更多未切除的内含子,表明未被剪接的RNA更倾向于富集到核斑体中。作者进一步将INSE分为INSE(intron) 和INSE(exon),前者衡量未被剪切的RNA(pre-mRNA)在核斑体的富集水平, 而后者衡量全部RNA(包括剪接和未剪接的)在核斑体的富集程度。加入RNA剪接抑制剂Pladienolide B前后的INSE(intron)表现出了高度的一致性,说明Pladienolide B并没有明显影响pre-mRNA在核斑体内和整个细胞内的浓度比例;而部分基因的INSE(exon)则在加入Pladienolide B之后出现了明显增加。作者进而通过INSE(exon)的变化将基因组分成三组:A组是转录本在没有剪接抑制的正常情况下已经在核斑体内富集的基因;B组是转录本在没有剪接抑制的正常情况下不富集但在剪接抑制的情况下富集的基因;C组是转录本在两种情况下都不富集的基因。A组转录本不论在是否加入Pladienolide B是都有最高的INSE(intron)和INSE(exon)值,表明它们倾向于稳定地定位于核斑体中。B组组转录本不论在是否加入Pladienolide B是都有较高的INSE(intron),表明B组基因的pre-mRNA在核斑体中富集。然而B组转录本的INSE(exon)值在加入Pladienolide B后由低变高,这表明B组基因在是在pre-mRNA阶段短暂富集在核斑体并在剪接过后离开核斑体;而剪接抑制导致了pre-mRNA在整个RNA中的比例增加,从而导致INSE(exon)值的增加。最后,C组转录本在Pladienolide B加入前后都没有在核斑体富集。
基于对基因组的以上分类,作者进一步和其他的发表数据进行对比分析,揭示了A,B和C组基因在表达过程中的区别。首先,A组和B组基因的位置离核斑体更近,揭示了基因位置对RNA在核斑体中定位也存在一定影响。然后相对于B组基因的pre-mRNA富集在核斑体表面,A组基因的未剪接转录本更倾向富集在核斑体内部,并且有一部分定位于远离于基因位点的核斑体内,体现出A组基因的转录本在核斑体中的定位有一部分是在转录后发生。其次,A组基因中切除速度慢的,或在转录后(post-transcriptional)切除的内含子的数量更高,这与A组基因转录本中未切除的内含子明显高于B和C组基因相吻合。这些观察表明A组基因更倾向于受到转录后的调控机制的影响。最后通过在细胞中敲除SON和SRRM2或者过表达CLK1破坏核斑体结构,并用RT-PCR评估随机挑选的A,B和C组基因的剪接效率,作者发现核斑体显著促进了A组和B组基因的内含子切除,而对C组没有影响。这些结果表明核斑体并非RNA剪接的必要结构,对于在其中富集的RNA剪接,包括短暂停留的B组基因的pre-mRNA,有促进作用。
为了进一步了解核斑体如何选择性地调控不同基因的剪切,除了以上提到的基因位置与核斑体的空间距离的影响,作者通过对INSE值构建了回归模型,揭示了与核斑体定位相关联的RNA序列特征。该模型显示出,稳定定位于核斑体的A组基因具有高GC含量,较短的内含子,较弱的剪切相关序列,体现在位于较弱的5'和3' 剪接位点中间的含有较高ML score的内含子序列组合。ML score是Regev课题组之前通过机器学习模型得出的一个剪切参数,用来表示一个序列在剪接中是否会被定义成外显子。比如较高的ML score倾向于对应较多的SR 蛋白(通常认为是外显子增强子)结合点,而较低的ML score倾向于对应较多的hnRNP 蛋白(通常认为是外显子抑制子)结合点。值得注意的是,较高GC含量,较短的内含子,较弱的剪接位点,以及内含子上含有较多SR蛋白结合位点是文献中记录过的和内含子滞留(intron retention)相关的序列特征,这与文中观察到的A组基因转录本中含有较高未切除内含子相吻合。而B组基因的pre-mRNA具有与A组转录本类似的较高GC含量和较短的内含子,但是于A组转录本不同额较强的剪切相关序列:体现在位于较强的5'和3' 剪接位点中间的含有较高ML score的外显子序列组合,这些序列特征也符合它们较高的剪接效率。
总而言之,作者运用ARTR-seq方法,揭示出RNA在核斑体中的不同动态富集模式:一部分基因的转录本能够稳定地聚集在核斑体中,对应着较慢的转录后剪切;另一部分基因的转录本能够动态地进入核斑体在剪切完成后迅速离开;这两类基因的剪接效率受核斑体影响。最后一部分基因的转录本完全不进入核斑体,其剪接也不受核斑体影响。研究揭示了基因在细胞核内的空间分布,RNA序列,RNA在核斑体中定位以及RNA剪切中的复杂相互关联,为理解核斑体在RNA动态剪切过程中的作用提供了新的视角。研究最后进一步揭示了核斑点在热休克应激(heat shock)下调控内含子滞留的重要功能。这些发现为进一步探索核斑体在基因表达调控中的功能,以及可能的调控机制奠定了基础,并且可能对理解相关生物学过程和疾病机制产生深远的影响。
参考文献
https://www.science.org/doi/10.1126/sciadv.adp7727责编|探索君
排版|探索君
来源|BioArt
End