计算TMB一切向标准看齐……
最近小编被各种纷纷绕绕的TMB算法所困扰,目前FDA批准的FoundationOne CDx (F1CDx, 315 genes), MSK-IMPACT (468 genes) 临床诊断试剂盒中,F1CDx采用的是tumor-only的测序方式,而MSK-IMPACT采用的是tumor配对normal的方法。在计算TMB的时候F1CDx将同义突变考虑其中并排出了热点驱动突变,此外抑癌基因的stop-gain mutations也被排除在外以减少相关的偏向性。在一些文献中认为F1CDx的TMB计算方法会更为合理[5]。因此在准确计算TMB之前我们必须要搞清楚一些概念,致癌基因与抑癌基因,驱动突变和乘客突变。
一些大规模的基因组测序项目例如TCGA [2] the CGP [3] and the International Cancer Genome Consortium[4]目的都是识别与人类相关的癌症基因。截止到2019年10月,我们可以在COSMIC数据库中找到总共与癌症相关的724个基因。这些基因在癌症中可能分别扮演着oncogene,TSG, fusion其中的一种或者多种角色。致癌基因(Oncogene)是那些可以发生驱动突变或者导致产生新功能的驱动基因。抑癌基因(Tumor suppressors)恰恰相反是抑制驱动突变发生的基因一个基因即可以是抑癌基因也可以是致癌基因。
驱动突变(Driver mutations)是致癌的主体,乘客突变(Passenger Mutations)可能无用,可能起到了辅助作用。驱动突变常常位于驱动基因;乘客突变常常位于乘客基因;癌症驱动突变不一定是错义突变,但基本是是错义的,不仅仅一个突变可能是驱动突变,大范围的变异也可能是驱动突变,像拷贝数变异;不是所有的错义突变都能导致癌症,是那些能够造成驱动突变的突变会有更大可能导致癌症。
在突变类型上,一般somatic SNV与somatic CNV呈现负相关。驱动突变一般是不会发生在germ-line DNA,但是也可以是inherited 。10%的癌症基因是germ-line mutations,而10%的癌症基因拥有germ-line and somatic mutations ,80%的癌症基因只呈现somatic mutations 。在一项11 adult cancer types 研究表明每个样本在外显子区域平均存在200个somatic point or small insertion/deletion,这其中有2到6个不等的可被预测为驱动突变[5]。
在识别候选的驱动基因上,比较著名的生信工具有OncodriveCLUST,主要是通过对变异位点频率的cluster来实现。此外蛋白质三维结构信息也可以在识别驱动突变上提供较大帮助,这方面的生信工具有Cancer3D、HotSpot3D[6]。
最终在识别驱动基因和驱动突变上这里最后给大家隆重推荐一篇综述性并兼顾生信分析的高质量文献,该文章对目前已有的致癌驱动基因与抑癌基因识别以及驱动位点识别上的所有工具进行了整合和测试,并在最后开源了一款同样的分析软件:
CompositeDriver(https://github.com/khuranalab/CompositeDriver)。
参考文献:
1.Xu Z, Dai J, Wang D, et al. Assessment of tumor mutation burden calculation from gene panel sequencing data[J]. OncoTargets and therapy, 2019, 12: 3401.
2.Cancer Genome Atlas Research Network. Comprehensive genomic characterization defines human glioblastoma genes and core pathways[J]. Nature, 2008, 455(7216): 1061.
3.Futreal P A, Coin L, Marshall M, et al. A census of human cancer genes[J]. Nature reviews cancer, 2004, 4(3): 177.
4.International Cancer Genome Consortium. International network of cancer genome projects[J]. Nature, 2010, 464(7291): 993.
5.Pon J R, Marra M A. Driver and passenger mutations in cancer[J]. Annual Review of Pathology: Mechanisms of Disease, 2015, 10: 25-50.
6.Cheng F, Zhao J, Zhao Z. Advances in computational approaches for prioritizing driver mutations and significantly mutated genes in cancer genomes[J]. Briefings in bioinformatics, 2015, 17(4): 642-656.
7.Bailey M H, Tokheim C, Porta-Pardo E, et al. Comprehensive characterization of cancer driver genes and mutations[J]. Cell, 2018, 173(2): 371-385. e18.