科学家将机器学习与血液代谢物信息相结合,开发出一种新的早期诊断测试,能够以 93% 的准确率检测卵巢癌。
三十多年来,医生一直未能对卵巢癌进行高度准确的早期诊断测试。现在,佐治亚理工学院综合癌症研究中心 (ICRC) 的科学家将机器学习与血液代谢物信息相结合,开发出一种新的测试方法,能够在该团队研究组的样本中检测出卵巢癌,准确率达到 93%。
红十字国际委员会创始主任、该研究的通讯作者、生物科学学院名誉教授约翰·麦克唐纳 (John McDonald) 解释说,新检测方法在检测卵巢癌方面的准确性比现有针对临床分类为正常女性的检测方法要好,而且有特别提高。检测该队列中的早期卵巢疾病。
该团队的结果和方法在一篇新论文“卵巢癌诊断的个性化概率方法”中进行了详细介绍,该论文发表在医学杂志《妇科肿瘤学》 2024 年 3 月在线期刊上。根据他们的计算机模型,研究人员开发了他们认为的方法这将是一种在临床上更有用的卵巢癌诊断方法——患者的个体代谢特征可用于更准确地确定疾病存在或不存在的概率。
麦克唐纳说:“这种个性化、概率性的癌症诊断方法比传统的二元(是/否)测试更具临床信息性和准确性,它代表了卵巢癌以及其他癌症早期检测的一个有前途的新方向。”
无声杀手
卵巢癌通常被称为无声杀手,因为这种疾病在首次出现时通常是无症状的,并且通常直到发展的后期阶段才被发现,此时难以治疗。
McDonald 解释说,虽然晚期卵巢癌患者的平均五年生存率(即使在治疗后)也约为 31%,但如果卵巢癌得到早期发现和治疗,平均五年生存率将超过90%。“显然,非常需要对这种潜在疾病进行准确的早期诊断测试。”
尽管三十多年来人们一直在大力追求卵巢癌早期检测测试的开发,但早期、准确的诊断测试的开发已被证明是难以实现的。麦克唐纳解释说,因为癌症是从分子水平开始的,所以有多种可能的途径甚至能够导致相同的癌症类型。
麦克唐纳说:“由于患者之间存在这种高水平的分子异质性,因此不可能鉴定出卵巢癌的单一通用诊断生物标志物,出于这个原因,我们选择使用人工智能的一个分支——机器学习——来开发另一种概率方法来应对卵巢癌诊断的挑战。”
代谢特征
佐治亚理工学院的合著者 Dongjo Ban 的论文研究对这项研究做出了贡献,他解释说:“众所周知,代谢水平的终点变化反映了多个分子水平上共同作用的潜在变化,因此我们选择代谢谱作为支柱我们的分析。”
合著者 Jeffrey Skolnick 补充道:“人类代谢物的集合是细胞健康状况的集体衡量标准,通过不预先任意选择任何子集,可以让人工智能找出哪些是特定细胞的关键参与者。”
质谱分析可以通过检测代谢物的质量和电荷特征来识别血液中代谢物的存在。然而,Ban 说,代谢物的精确化学组成需要更广泛的表征。
Ban 解释说,由于迄今为止,人类血液中循环的代谢物中不到 7% 的精确化学成分已被化学表征,因此目前不可能准确地查明影响个体代谢特征的特定分子过程。
然而,研究小组认识到,即使不知道每种代谢物的精确化学组成,仅通过质谱检测到不同个体的血液中存在不同的代谢物,就可以将其作为特征纳入构建基于机器学习的准确预测模型(类似于在构建面部模式识别算法中使用个人面部特征)。
“已知有数千种代谢物在人体血液中循环,可以通过质谱法轻松准确地检测它们,并结合机器学习来建立准确的卵巢癌诊断。”Ban 说。
一种新的概率方法
研究人员开发了他们的综合方法,将代谢组学特征和基于机器学习的分类器相结合,建立了一种诊断测试,在对来自佐治亚州、北卡罗来纳州、费城和加拿大西部的 564 名女性进行测试时,准确率达到 93%。研究参与者中有 431 名是活跃的卵巢癌患者,而研究中的其余 133 名女性则没有患有卵巢癌。
麦克唐纳说,进一步的研究已经开始,以研究该测试能够检测出没有临床症状的女性的非常早期疾病的可能性。
麦克唐纳预计,在临床未来,一个人的代谢特征处于极不可能患癌症的分数范围内,只需要每年进行监测。但是,如果某人的代谢评分处于大多数(例如 90%)之前被诊断出患有卵巢癌的范围内,则可能会受到更频繁的监测,或者可能会立即转介进行高级筛查。