近日,求臻医学科研团队开发了一种创新智能MSI预测方法:MSIscope。该方法依托人工智能深度学习技术,通过解析病理图像中的多尺度特征,完成对MSI状态的精准预测,实现了只需一张病理白片,半日内出检测结果的病理MSI智能检测,为癌症等疾病的诊断与治疗提供了有力支持。
目前,该研究成果已被生物信息学领域的重要国际会议—IEEE International Conference on Bioinformatics & Biomedicine(BIBM,CCF B)录用。
研究背景
微卫星不稳定性(Microsatellite instability, MSI)是指在DNA复制过程中,错配修复机制失效,导致重复片段的增加或减少,最终引起微卫星长度的变化。根据MSI水平的高低,可将MSI分为三种类型:低微卫星不稳定(MSI-L)、高微卫星不稳定(MSI-H)以及微卫星稳定(MSS)。
近年来,研究发现MSI作为重要标志物与多种疾病特征息息相关,其中绝大多数为肿瘤,尤其是子宫内膜癌、结直肠癌、胃癌等。检测MSI状态能够为患者的诊断与治疗提供重要指导。
目前,MSI相关的检测方法主要有3种:免疫组化(IHC)、聚合酶链式反应(PCR)和高通量测序技术。基于这些技术开发的MSI预测方法,面临着高成本以及在低肿瘤纯度条件下准确度受限的挑战。病理学诊断被广泛视为癌症等多种疾病诊断的“金标准”,在精准医学时代发挥着愈加重要的作用。
研究设计
求臻医学自主研发的检测MSI状态的MSIsensor算法,早在2017年被FDA批准的首个基于高通量测序技术的肿瘤多基因检测试剂盒(MSK-IMPACT™)所采用,随后陆续被《结直肠癌分子检测高通量测序中国专家共识》等国内多个分子检测专家共识所推荐。此外,在MSIsensor的基础上,通过多环节引入人工智能技术,求臻医学持续研发了基于单肿瘤组织和外周血游离DNA(cfDNA)测序数据的MSI状态检测算法MSIsensor2与MSIsensor-ct。
图1. MSIscope 架构图
基于前期研究基础,求臻医学科研人员提出了一种基于人工智能深度学习算法的多尺度病理图像MSI预测方法:MSIscope。病理图像是一类特殊的高分辨率图像,每张图像的像素量可高达十亿,蕴藏着丰富的表型信息。该方法以Transformer架构为基础,针对病理图像的多尺度特性和MSI的特定病理特征,设计了感兴趣区域ROI选择、多尺度视野扩展和多分辨率特征融合等模块,高效定位并提取关键区域特征,融合跨区域、跨尺度的上下文信息,克服了现有方法的局限性。
图2. MS-Transformer 模型架构图
研究结果
研究结果显示,MSIscope在泛癌种病理图像数据集上表现优异,其预测准确性(AUROC)达到了0.911,远超同类方法。更令人振奋的是,该技术仅需一张病理白片,便能在半天内完成MSI状态的智能预测,极大地提高了检测效率。此外,MSIscope在低肿瘤纯度的病理切片中也展现出卓越的鲁棒性,进一步拓宽了其应用场景。
MSIsensor/MSIsensor2/MSIsensor-ct系列算法已经被超过710篇论文引用,为国际上引用数最高的基于高通量测序技术的泛癌种MSI探测工具集;应用于超过30个国家的700项临床研究中;被实际应用于超过23万例癌症病人的MSI检测。MSIscope的提出能够为MSI状态的判断提供新的视角,是对求臻医学上述研发的MSI检测算法体系的有效补充,将为更多肿瘤患者的精准诊疗带来福音。