引言
迫切需要新型抗生素来对抗抗生素耐药性危机。2024年6月5日,复旦大学类脑智能科学与技术研究院与美国宾夕法尼亚大学的研究人员合作在Cell 在线发表题为“Discovery of antimicrobial peptides in the global microbiome with machine learning”的研究论文,该研究提出了一种基于机器学习的方法来预测全球微生物组中的抗菌肽(AMPs),并利用来自环境和宿主相关栖息地的63,410个宏基因组和87,920个原核基因组的庞大数据集来创建AMPSphere,这是一个包含863,498个非冗余肽的综合目录,其中很少与现有数据库匹配。
AMPSphere提供了对肽进化起源的见解,包括通过复制或基因截断较长的序列,该研究观察到AMP的产生因栖息地而异。研究人员在体外和体内合成并测试了100种抗菌肽对临床相关耐药病原体和人类肠道共生菌的作用。共有79个肽具有活性,其中63个靶向病原体。这些活性AMPs通过破坏细菌膜表现出抗菌活性。总之,该研究的方法鉴定了近100万个原核AMPs序列,这是发现抗生素的开放资源。
![](http://image.uc.cn/s/wemedia/s/upload/2024/a3410dd268033e8b0b268938cb29444e.jpg)
![](http://image.uc.cn/s/wemedia/s/upload/2024/18a27db5e50fdc371fe21d07192ed492.jpg)
模式图(Credit: Cell)
由于技术限制,宏基因组分析在AMPs研究中的应用受到限制,主要源于区分真实蛋白质编码序列和假阳性序列的挑战。因此,小开放阅读框(smORFs)的重要性在(meta)基因组分析中一直被忽视。近年来,人类相关smORFs的宏基因组分析取得了重大进展。这些进步结合了机器学习(ML)技术来识别编码属于特定功能类别的蛋白质的smORFs。值得注意的是,最近的一项研究使用预测smORFs从人类肠道微生物的宏基因组样本中发现了大约2000个AMPs。然而,值得注意的是,人类肠道只代表了整体微生物多样性的一小部分,这表明在全球不同栖息地的原核生物中发现AMPs仍然有巨大的潜力。该研究使用ML来预测和编目目前在公共数据库中表示的全球微生物组中的AMPs。通过计算探索63410个公开可用的宏基因组和87920个高质量的微生物基因组,该研究发现了大量的AMPs多样性。这导致了AMPSphere的创建,这是一个863,498个非冗余肽序列的集合,包括来自(元)基因组数据的候选AMPs (c_AMPs)。值得注意的是,这些c_AMPs序列中的大多数以前没有被描述过。分析表明,这些c_AMPs是特定于特定栖息地的,并且在泛基因组中主要不是核心基因。此外,该研究从AMPSphere中合成了100个c_AMPs,发现79个具有活性,其中63个在体外对临床重要的ESKAPEE病原体具有抗菌活性,这些病原体被认为是公共卫生问题。将这些肽与加密肽(EPs)进行比较,发现它们具有靶向细菌膜的能力,并倾向于采用α-螺旋结构和β-结构。值得注意的是,主要候选药物在临床前动物模型中显示出有希望的抗感染活性。总之,该研究证明了ML方法从全球微生物组中识别功能性AMPs的能力。原文链接https://doi.org/10.1016/j.cell.2024.05.013责编|探索君
排版|探索君
文章来源|“iNature”
End