参考消息网10月30日报道据英国《自然》周刊网站10月15日报道,八月中旬的一个周六早晨,亚历克斯·纳卡在他女朋友的厨房里踏上了一场“小型黑客马拉松”。借助一台笔记本电脑、一杯咖啡以及大约80个云端人工智能(AI)处理器,他生成了大量计算机设计的蛋白质,这些蛋白质旨在阻断在一些肿瘤中发生突变的细胞受体。
掀起热潮
纳卡是美国加利福尼亚州阿拉梅达一家医疗技术公司的蛋白质工程师。他将最有希望获奖的十个结果提交到了一场刚刚启动的蛋白质设计竞赛中,并看着它们攀升至排行榜前列。
这场竞赛的主办方是瑞士洛桑的生物技术初创企业适应性生物公司。过去一年左右,世界各地出现了至少五种此类竞赛。大多数参赛者都会使用“阿尔法折叠”程序(AlphaFold)和受到聊天机器人启发的“蛋白质语言模型”等AI工具,这些工具在适用范围和能力上都出现了爆炸式增长。其中一些工具背后的研究人员被授予今年的诺贝尔化学奖。他们获得这一荣誉的部分原因在于,新创造的蛋白质有望成为更有效的药物、工业酶或实验室试剂。
但科学家们表示,人工设计蛋白质的热潮制造了很多混乱。人们设计蛋白质的速度快于这些蛋白质在实验室中制造和测试的速度,因此很难判断哪些方法是真正有效的。
引发混乱
过去,竞赛推动了重要的科学进步,特别是在蛋白质结构预测领域。当前一系列最新的竞赛通过降低门槛,吸引了世界各地的人士进入蛋白质设计相关领域。它们还可能加快验证和制定标准的步伐,有助于培育相关社群。位于西班牙巴塞罗那的基因调控中心的计算生物学家诺埃利娅·费鲁斯·卡帕佩说:“竞赛将推动该领域向前发展,并更快地测试方法。”
但科学家们表示,这些竞赛必须克服一些困难,例如确定解决哪些问题,以及如何客观地决定获胜者。找到正确的方法很重要。德国慕尼黑理工大学的计算生物学家布克哈德·罗斯特说,如果执行不当,“这些竞赛可能会对该领域造成损害”。
这些蛋白质设计竞赛在一定程度上受到了一个已有30年历史的竞赛的启发,后者帮助推动了生物AI革命。自1994年以来,这场名为“蛋白质结构预测关键评估”(CASP)的竞赛一直鼓励科学家们通过蛋白质的氨基酸序列预测其3D形状。该竞赛由美国马里兰大学的计算生物学家约翰·莫尔特和美国加州大学戴维斯分校的计算生物学家克日什托夫·菲德利斯发起,通过将计算预测结果与未发表的结构模型进行比较来确定获胜者。
2018年,总部位于伦敦的“深层思维”公司(现为谷歌旗下公司)凭借其蛋白质结构预测工具、第一代AlphaFold在CASP获胜。第二代工具AlphaFold2在2020年表现优异,莫尔特甚至宣布预测简单蛋白质结构的问题基本上已经解决。自那以后,该竞赛已将重点转移到其他新兴挑战上,例如预测复合体中多个相互作用蛋白质的结构。
推动发展
现在,许多人希望这些竞赛能够推动蛋白质设计领域向前发展,就像CASP帮助推动蛋白质结构预测领域的革命一样。罗斯特说:“如果没有CASP,就不会有AlphaFold。我们需要这些竞赛发挥正确作用,为人们提供激励。”
今年6月,罗斯特及其同事赢得了由开放科学非营利组织协同创新组织主办的“蛋白质工程大赛”。该活动包括两部分。首先,参与者尝试预测不同酶变体的性质。在这一轮中表现最好的团队随后重新设计一种分解淀粉的酶,根据实验室结果确定最佳设计。2025年的竞赛正在筹备中。
“冬季蛋白质设计赛”由加拿大生物技术公司自由生物公司和维护蛋白质建模工具的学术组织罗塞塔共享联盟共同主办。该竞赛在今年4月宣布了获胜者。参赛者需重新设计一种现有蛋白质——一种在蛋白质纯化中广泛使用的植物病毒酶,使其分子更有效。
另有两场竞赛要求参赛者设计出全新的蛋白质。适应性生物公司主办的竞赛正在寻找能够附着在表皮生长因子受体(EGFR)上的蛋白质。EGFR是一种在许多癌症中过度活跃的生长激素受体。90名参赛者提交了700多个设计。
而在“AI设计蛋白质结合剂”大赛中,研究人员正努力创造可用于T细胞癌症治疗的小蛋白。该竞赛由美国得克萨斯大学奥斯汀校区研究生领导的组织“生物学与机器学习学会”主办,吸引了来自42个国家——包括尼日利亚、哥伦比亚、伊朗和印度——的64个团队参赛。目前约有1.8万个设计结果正在接受测试,结果将于2025年初公布。该大学生物化学博士生、竞赛联合组织者克莱顿·科索诺基说:“居然有这么多人参赛,我们感到很惊讶。”(编译/熊文苑)