臻话MSI | 第一期
微卫星不稳定性(Microsatellite instability,MSI)作为重要标志物与多种疾病特征息息相关,其中绝大多数为肿瘤,尤其是子宫内膜癌、结直肠癌、胃癌等。随着NGS等检测技术的发展,MSI在肿瘤中的秘密被逐层揭开。求臻医学推出的“臻话MSI”系列专栏,旨在从多角度介绍MSI及其在肿瘤精准医疗领域的应用,推动肿瘤精准医疗领域的发展。
真核生物基因组中广泛存在着串联重复序列。根据重复单位大小的不同,可分为3类:卫星DNA、小卫星DNA和微卫星DNA。小卫星和微卫星DNA具有极高多态性,是医学研究和应用的重点。
20世纪80年代末,Marshfield医学研究基金会的James和俄勒冈健康科学大学的Wis等人分离出来一种比小卫星DNA具有更短重复单元的卫星DNA,被称为微卫星DNA(Micro Satellite DNA),又被称作短串连重复序列(Short Tandem Repeats,STRs)或简单重复序列(Simple Sequence Repeat,SSRs)。
这种短的、重复的单核苷酸、二核苷酸或更高阶核苷酸重复序列,单位长度从1~6个碱基不等,通常重复10~60次,它们散布在人类基因组中,其中以(CA)n为主。
以微卫星发生频率的改变为特征的基因组不稳定性被称为微卫星不稳定性,于1993年被Jacobs等人在结直肠癌中首次发现。即与同一个体的正常组织细胞的DNA相比,异常细胞的基因组DNA中单个、二个、三个或四个核苷酸组成的重复序列的长度发生了改变。同一微卫星位点在不同个体之间以及同一个体的正常组织与某些异常组织之间,重复单位的数目也有所不同。
根据MSI水平的高低,可将MSI分为三种类型:低微卫星不稳定(Low Microsatellite Instability,MSI-L)、高微卫星不稳定(High Microsatellite Instability,MSI-H)以及微卫星稳定(Microsatellite Stability,MSS)。
目前认为微卫星不稳定性产生的原因主要包括点突变、滑链错配、错配修复缺陷:
点突变
与其他基因点突变相似,DNA复制过程中存在出错的概率。另外,非Watson-Crick碱基配对形成后会扭曲双链DNA螺旋,这种错配也有可能引起突变。
滑链错配
一般认为,DNA复制过程中的滑链错配(slipped-strandmispairing)是导致重复序列多态性的主要机制。由于重复序列的存在,这些位点容易由于DNA聚合酶滑移而导致DNA复制错误。在DNA合成过程中,一条单链DNA可以发生一过性脱位,生成一个中间性的结构后(主要为环状结构),再与另一条DNA单链错配,形成链滑动,继续DNA的复制或修复。这可能导致合成链上发生滑移时插入额外的碱基,或者在模板链上发生滑移时移除碱基,从而导致DNA链不匹配。
错配修复缺陷(MMR deficient,dMMR)
微卫星序列是DNA复制过程中最容易发生错配的序列。据估计,DNA聚合酶epsilon和delta大约每聚合104至105个核苷酸就会出错一次。因此,每次细胞分裂时,大约有100,000个聚合酶发生错误,这必须通过具有3'-5'外切酶活性的DNA聚合酶Ⅲ的ε和δ亚基,在合成过程中进行校对,将错误的核苷酸切掉来纠正。然而,有些错误总是逃过校对,则需要碱基错配修复(mismatch repair,MMR)系统进行切除修复来得以有效纠正。
MMR是一种高度保守的细胞过程,在DNA复制过程中起重要作用。MMR主要负责在DNA复制后对碱基进行修复,另外也可以修复一些小的核苷酸插入或缺失。MMR的关键基因包括MLH1(Mult homolog 1)、MSH2(Mult homolog 2)、MSH6和PMS2(postmeiotic segregation increased 2)等。
图1 dMMR导致MSI产生的机制
MMR蛋白在DNA复制、遗传物质重组和化学或物理损伤过程中以异二聚体复合物的形式存在,这些复合物包括MutSα(MSH2蛋白与MSH6蛋白组合)、MutLβ(MLH1蛋白与PMS1蛋白组合)、MutSβ(MSH2蛋白与MSH3蛋白组合)和MutLα(MLH1蛋白与PMS2蛋白组合)。
在DNA复制发生错配后,首先MutSα识别并结合DNA链,招募MutLα,经构象改变后,从错误位点释放,随后招募核酸外切酶-1切除错配区域,复制因子A稳定单链DNA,由DNA聚合酶δ和增殖细胞核抗原形成的复合物填补空缺,最后由DNA连接酶修复缺口。有研究证实,MMR使DNA复制的准确性提高了100~1000倍。若MMR基因突变或启动子CpG岛的甲基化导致蛋白功能缺陷,基因组中的损伤不能及时修复,错误的逐渐积累加剧基因的变异,进而产生MSI。
MSI的产生可能导致框移突变(Frameshift Mutation),即移码突变,使受损基因所编码的蛋白结构异常,甚至可引起受影响的细胞形成肿瘤。
另外,由于微卫星序列易出错的性质,MSI也是许多疾病的特征,其中绝大多数为肿瘤,尤其是子宫内膜癌、结直肠癌、胃癌等。
15%的大肠癌患者是MSI-H。同时,MSI-H的发生率因结直肠癌肿瘤分期不同而异:Ⅱ期约为20%,Ⅲ期约为12%,而IV期患者的MSI-H则要少得多(约4%)。散发性MSI最常见的原因是MLH1启动子表观遗传沉默,通过CpG岛的异常甲基化,并与体细胞BRAF V600E突变有关。
胃癌中MSI表型主要是由MLH1的表观遗传高甲基化引起的,而不是MMR基因的种系突变。
图2 MSI-H在不同肿瘤的发生率
在非肿瘤疾病中,MSI相关疾病以遗传性非息肉病性结直肠癌(Hereditary Nonpolyposis Colorectal Cancer,HNPCC),即林奇综合征(Lynch syndrome,LS)最为著名。林奇综合征是一种常染色体显性遗传病,其特征是卵巢癌、肾癌、膀胱癌、胃癌、小肠癌、胆管癌、脑肾癌、胆囊癌和皮脂腺肿瘤的风险增加,其中子宫内膜癌(EC)和结直肠癌(CRC)的风险增加最大。
想了解更多MSI检测相关知识,且听下期精彩解析:臻话MSI | 第二期:MSI检测方法、意义及适用人群。
求臻医学生信算法开发能力国际领先
求臻医学具备国际顶尖的基因组信息学团队,拥有国际领先的生物信息分析平台及算法,所开发的MACS、MSIsensor、HotSpot3D等算法已在业内应用并广受好评。
求臻医学自主研发的MSIsensor算法被FDA批准的首个基于NGS的肿瘤多基因检测试剂盒(MSK-IMPACT)所采用,同时被近期发布的《结直肠癌分子检测高通量测序中国专家共识》所推荐。
在MSIsensor的基础上,求臻医学多环节引入人工智能技术,持续研发了基于单肿瘤组织和外周血游离DNA(cfDNA)测序数据的MSI状态检测算法MSIsensor2与MSIsensor-ct。截至2021年7月,MSIsensor/MSIsensor2/MSIsensor-ct系列算法已经被超过310篇论文引用,为国际上引用数最高的泛癌种NGS-MSI探测工具集;同时被超过27个国家的670个临床研究项目所应用,持续推动肿瘤免疫治疗领域的研究进展。