引言
随着人工智能(AI)技术在医学领域的广泛应用,AI辅助工具在疾病诊断、评估和临床试验中的作用越来越重要。在非酒精性脂肪肝病(NAFLD)相关的代谢性肝病(MASH,Metabolic Associated Steatotic Hepatitis)评估中,AI技术为病理评分提供了高效、精准且标准化的解决方案。传统的病理评分依赖于病理学家的经验和主观判断,这不仅增加了评估的复杂性,还存在较大的个体差异和可重复性问题。为了弥补这一不足,AI辅助工具应运而生,尤其是AIM-MASH(Artificial Intelligence Model for MASH)算法,展现了其在提高评分一致性、可重复性及准确性方面的巨大潜力(11月4日 Nature Medicine “Clinical validation of an AI-based pathology tool for scoring of metabolic dysfunction-associated steatohepatitis”)。AIM-MASH的算法通过分析全切片图像(WSI,Whole Slide Imaging)中的关键特征,如脂肪变性(steatosis)、肝小叶炎症(lobular inflammation)、肝细胞气球样变(hepatocellular ballooning)和纤维化(fibrosis),为病理学家提供了重要的辅助信息,帮助其更为高效地完成疾病诊断与分期。研究表明,AIM-MASH能够显著提高病理学家的评分精度,并且在多中心、多操作员和多扫描仪的情况下,保持了较高的重复性和一致性。特别是在MASH临床试验中,AIM-MASH作为辅助工具,不仅能提升病理学家的诊断一致性,还能够通过标准化评分,降低由人为因素带来的误差。通过对AIM-MASH的多项验证研究,证实了其在临床试验中的巨大潜力。无论是在提高病理评分的准确性、降低试验偏差,还是在推动新药候选者的临床试验评价中,AIM-MASH都表现出显著的优势。其不仅能够在较为复杂的评分系统中保持高度一致性,甚至在肝细胞气球样变和肝小叶炎症等难度较大的评分项中,仍能保证准确性与高可重复性。总的来说,AIM-MASH算法作为AI辅助病理评分工具,不仅有效改善了传统病理学评估的局限性,还为未来的临床研究和药物开发提供了更为可靠的评价手段。在接下来的研究中,AIM-MASH有望成为临床实践中不可或缺的一部分,推动MASH相关疾病的早期诊断与治疗,为患者提供更精准的治疗方案。非酒精性脂肪肝病的挑战非酒精性脂肪肝病是一种常见的肝脏疾病,通常伴随着肝脏内脂肪的积累。随着肥胖、糖尿病等代谢疾病的普及,NAFLD的患病率呈逐年上升趋势。NAFLD的进展可能导致非酒精性脂肪性肝炎(NASH),而后者如果未得到有效治疗,可能发展为肝纤维化、肝硬化甚至肝癌。因此,如何准确评估NAFLD的病理进展,特别是从NASH到肝纤维化的过渡,一直是临床医学中的一个重大挑战。NAFLD的评估通常采用病理评分系统,其中包括脂肪变性(steatosis)、肝小叶炎症(lobular inflammation)、肝细胞气球样变(hepatocellular ballooning)和纤维化(fibrosis)。这些指标的综合评分被广泛应用于临床试验和药物评估中。然而,病理评分的标准化、准确性和 可重复性常常受到样本质量、病理学家经验及其主观判断的影响,导致不同实验室之间、不同病理学家之间的评分差异较大。因此,提升病理评分的一致性和准确性是当今NAFLD研究中亟待解决的问题。AIM-MASH算法:提升病理评分的一致性与准确性AIM-MASH是一款基于人工智能的病理评分工具,旨在帮助病理学家提高评分的标准化和一致性。该算法通过分析肝脏活检样本中的全切片图像(WSI,Whole Slide Imaging),自动识别肝脏组织中的脂肪变性、肝小叶炎症、肝细胞气球样变以及纤维化等病理特征,并对其进行精确的评分。相比传统的人工评分,AIM-MASH具有显著的优势:它能自动化地处理大量数据,减少人为主观差异,且能够确保评分的一致性和准确性。AI辅助工作流程与代表性的AIM-MASH覆盖层和GT小组工作流程(Credit: Nature Medicine)
AI辅助工作流程:在AI辅助工作流程中,主要病理学家会首先审核AIM-MASH的输出结果,并对组织切片进行质量控制(Quality Control,QC)检查。这个过程包括对苏木精-伊红(Hematoxylin and Eosin,H&E)和马松三色染色(Masson’s Trichrome,MT)切片的审核,确认是否需要重新染色或重新扫描切片,确保所有试验特定的标准都得到了满足,并记录任何额外的发现。如果主要病理学家对某些MASH评分(即脂肪变性、肝小叶炎症、肝细胞气球样变、纤维化等)存在至少2分的分歧,该病例将转交给次级病理学家进行复核。次级病理学家会独立审核与AIM-MASH评分不一致的部分。如果次级病理学家同意主要病理学家的修改评分,那么该修改后的评分将作为最终评分;如果次级病理学家与主要病理学家意见不合,或同意AIM-MASH的原始评分,两个病理学家将进行一致性讨论(consensus call),达成一致后最终确定评分。GT小组工作流程:每个肝脏活检的金标准(Gold-Standard,GT)评分是由两个不同的小组中的肝病病理学家面板确定的。每个面板由两名主要病理学家和一名辅助的“平衡者”病理学家组成,后者的作用是解决主要病理学家之间评分的差异。如果主要病理学家之间的评分出现分歧,平衡者病理学家会介入并提供一个独立的评分。如果平衡者的评分与两位主要病理学家的评分都不同,并且无法达成一致,会议将被召集讨论,平衡者的评分在特殊情况下会作为决定性评分。对于中位数GT评分(Median GT),如果平衡者的评分与两位主要病理学家的评分分歧较大,则会采用三者评分的中位数作为最终评分。在建立GT评分的过程中,总共有五位病理学家参与了评分的制定。AIM-MASH的研究数据与验证AIM-MASH的研究数据表明,它在多个方面的表现优于传统手工评分。研究团队使用了代表性的临床试验数据集,包括了不同疾病活动性、染色方法、扫描地点以及药物干预等多种变量。研究中包含的样本中,不仅有正常的肝脏组织,还包括了病变较重的NAFLD样本。通过分析这些数据,AIM-MASH能够准确评估不同程度的脂肪变性、肝小叶炎症和肝细胞气球样变等病理特征。AIM-MASH与手工评分的对比在对AIM-MASH进行的重复性研究中,AIM-MASH的表现超出了预期的85%的准确性目标。例如,在评估脂肪变性(steatosis)、肝小叶炎症(lobular inflammation)、肝细胞气球样变(hepatocellular ballooning)和纤维化(fibrosis)等评分时,AIM-MASH的表现分别为0.72、0.55、0.70和0.72,这些数据显著优于传统手工评分的表现,其中脂肪变性和肝细胞气球样变的评分一致性较高,而肝小叶炎症和纤维化的评分一致性则稍低,但仍在可接受范围内。与多个病理学家之间的评分差异相比,AIM-MASH的表现更为一致。例如,AIM-MASH在三个外部实验室(不同的操作员和不同的Leica Aperio AT2扫描仪)中进行的跨实验室验证结果表明,其评分在所有MASH评分组件中均高于专业病理学家的评分一致性。具体来说,AIM-MASH对于脂肪变性、肝小叶炎症、肝细胞气球样变和纤维化的评分一致性分别为0.72、0.60、0.63和0.51,而专家病理学家之间的评分一致性则为0.63、0.55、0.70和0.72。AIM-MASH在这些试验中的高可重复性为其在临床研究中的广泛应用提供了有力支持。临床验证与疗效评估在多项临床验证研究中,AIM-MASH的表现进一步证明了其在药物评估中的可靠性。例如,在对semaglutide、pegbelfermin和resmetirom等药物的临床研究中,AIM-MASH成功显示出比手工评分更加一致的结果,尤其是在评估治疗效果方面。在一项2b期针对pegbelfermin的临床研究中,AIM-MASH揭示了治疗组和安慰剂组之间的统计学差异,而传统的病理学评分未能显示出显著差异。类似的,AIM-MASH在评估resmetirom的临床试验中也展示了更高的准确性和一致性。AIM-MASH在临床试验中的应用前景随着AI技术的不断进步,AIM-MASH在肝脏疾病的评估中展现出了广阔的应用前景。该算法不仅能够提高NAFLD临床试验中的病理评分一致性和标准化,还能帮助研究人员更好地评估药物的疗效,推动肝脏疾病的早期诊断和个体化治疗。AIM-MASH的一个关键优势在于其能够将AI与病理学家的专业判断结合起来。在临床试验中,病理学家通常需要在大量的病理切片中筛选出具有临床意义的病变部位,并根据病变的特征做出判断。AIM-MASH能够自动识别并标记出可能的病理特征,提供精确的评分,这为病理学家节省了大量的时间和精力。同时,AIM-MASH的标准化评分能够减少人为因素的干扰,提高不同病理学家之间的评分一致性。AIM-MASH作为一款AI辅助病理评分工具,已经在多个临床试验中展示了其优异的性能。它能够在保证准确性和一致性的基础上,帮助病理学家在肝脏疾病的诊断和评估中提供高效且标准化的评分。通过与人工评分的对比,AIM-MASH在临床验证中表现出色,为药物研发和临床试验的顺利进行提供了可靠支持。未来,随着技术的不断优化,AIM-MASH有望成为肝脏疾病临床试验和诊疗中的重要工具,推动肝病研究和精准医疗的发展。参考文献
Pulaski H, Harrison SA, Mehta SS, Sanyal AJ, Vitali MC, Manigat LC, Hou H, Madasu Christudoss SP, Hoffman SM, Stanford-Moore A, Egger R, Glickman J, Resnick M, Patel N, Taylor CE, Myers RP, Chung C, Patterson SD, Sejling AS, Minnich A, Baxi V, Subramaniam GM, Anstee QM, Loomba R, Ratziu V, Montalto MC, Anderson NP, Beck AH, Wack KE. Clinical validation of an AI-based pathology tool for scoring of metabolic dysfunction-associated steatohepatitis. Nat Med. 2024 Nov 4. doi: 10.1038/s41591-024-03301-2. Epub ahead of print. PMID: 39496972.责编|探索君
排版|探索君
转载请注明来源于【生物探索】
End