迈杰转化医学
欢迎来到迈杰转化医学官网!

迈杰转化医学

迈杰转化医学

服务热线400-007-1121服务热线

迈杰转化医学推动中国精准医疗健康发展

【杰论系列】从HRR到HRD

返回列表 来源: 发布日期: 2021.12.28

Human DNA Repair Genes并不是一个新的概念,目前已有超过270个基因,最早系统性的总结文章可以追溯到1999年,碱基切除修复(BER)、核苷酸切除修复(NER)和错配修复(MMR)涉及的基因各不相同,2018发表的以TCGA数据为基础的DNA损伤修复缺陷泛癌种基因组图谱综述是近期比较完整的总结。


文章使用整合基因组和分子分析来识别33种癌症类型中频繁出现的DNA损伤修复系统(DNA Damage Response or DNA Damage Repair, DDR)改变,将基因和通路水平的改变与基因组不稳定性和功能受损的全基因组测量相关联,并证明了DDR缺陷评分的预后效用。同时提出以下4个观点:


1)DNA损伤修复(DDR)基因改变在许多人类癌症类型中普遍存在

2)同源性重组(HR)和直接修复是最常见的改变

3)DDR功能缺失与癌症基因畸变的频率和类型有关

4)HR功能的改变与癌症类型的好坏有关


结果1:泛癌的DDR基因突变谱


先对DDR基因突变在泛癌种中进行统计,并且定义了一个包含71个DNA修复通路特异性基因和9个DNA损伤反应基因的“核心DDR”基因集,用于简化通路表达和分析。基于核心DDR基因列表的通路富集分析显示,在特定类型的癌症中,有几个DDR通路在统计学上富集,例如OV和BRCA癌症中的HR通路改变。两个DDR基因(TP53和POLE),与所有其他非DDR基因相比,显示了在改变和总体突变负荷之间存在本质上不同的关联。使用5种基于突变频率的肿瘤驱动基因预测方法分析276个DDR基因,所用数据为PanCanAtlas Drivers/Essentiality Working Group (Bailey et al., 2018),48 DDR genes被至少1个软件识别为潜在的驱动基因,其中8个假定的DDR驱动基因是某一癌症类型所特有的,而18个仅在PanCanAtlas 分析中被识别出来。其余23个假定的驱动因素是在对PanCanAtlas 分析中一种或多种独立的癌症类型的析中被识别出。此外还包括48个基因的突变特征频谱,该分析使用了PanCancer频谱导出的21个突变签名,分析显示变异信号19(POLE signature,同COSMIC信号10)在POLE-altered癌症中增加了4倍以上,在UCEC更明显。信号15(替莫唑胺信号,同COSMIC信号11)与MGMT改变存在关联。


图片

Figure 1. Cancer Types Display Variable DNA Damage Repair Gene Somatic Alterations


结果2:DDR基因和通路的频繁表观遗传沉默


表观遗传沉默被认为是导致复发性基因缺陷的另一重要机制。12个DDR基因表现出强烈而一致的甲基化驱动的转录沉默。最常被沉默的DDR基因是核心DR(直接修复)通路基因MGMT(11%)和ALKBH3(8%),其次是核心MMR基因MLH3(5%)和MLH1(4%)。HR和FA通路中的基因,如BRCA1、RAD51C、NSMCE3和FANCF,表观遗传沉默的现象较少。甲基化沉默是MGMT的主要改变(占所有改变的92.4%),通过突变特征分析,它与信号15显著相关。此外还发现高频的EXO5 沉默。不同癌种沉默的通路不同:在胃肠道肿瘤(ESCA、COAD、STAD和READ)、HNSC和GBM中,可以观察到核心DR、HR和MMR通路基因的频繁沉默。DLBCL和UCEC中DR通路频繁沉默。SKCM,ACC,LGG和UCEC的特征是MMR通路沉默的频率高,而OV, UCS,CESC,TGCT均表现为高频DR和HR通路沉默。


图片

Figure 2. Epigenetic  Sile ncing of DDR Genes and Pathways in Cancer


结果3:基因组不稳定与HR缺陷和预后有关


六种不同的SCNA评分之间存在正相关关系,这些评分用于描述全血细胞瘤图谱样本中非整倍体、LOH和同源重组缺失的程度。突变负荷和SCNA评分之间存在中度、统计学意义上显著的正相关关系,与之前报道的12种癌症类型的SCNA和突变频率之间的负相关关系相反(Ciriello et al. 2013)。带有大规模基因组不稳定性的基因组瘢痕被归因于同源重组缺陷(HRD) 。结合HRD- loh 、LST和NtAI的得分即为HRDscore,不同癌症类型的HRD评分差异很大,最高的是OV,最低的是KICH、KIRP)、LAML和THCA。许多癌症类型也有小的样本亚群具有高的HRD得分。在八种癌症类型中,HRD评分与PFI显著相关。HRD显著正相关的HR通路基因包括BRCA1、BRCA2、RAD51B和RAD51C。BRCA1变化在预测高HRD得分方面的正权重最大。BRCA1或RAD51B的改变增加了大多数癌症类型的HRD评分。TP53改变也与较高的HRD评分相关,这与之前观察到的TP53突变癌症中SCNA负担较高的结果一致)。其他一些MMR和NER基因的改变与HRD评分显著负相关,如MLH1、TCEB3和MSH2,表明HR和MMR或NER缺陷之间存在潜在的互斥关系。


图片

Figure 3. Somatic Copy-Number Alteration Scores in Relation to Clinical Outcomes and DDR Gene Alterations


文章确认了潜在破坏DDR功能的基因融合事件,经过人工检查比对在205年癌症样本中识别188高信任度融合事件涉及108 DDR基因,最常见的DDR基因为SMARCA4、PTEN、RAD51B和SMARCA1)。主要的融合(包括18个HR基因和5个MMR基因)在DDR功能区域都有断点,这些断点被具有破坏功能并导致易于预测的治疗结果,例如涉及RAD51B和BRCA1的HR基因融合。融合体也经常有多个伙伴基因,也有断点:例如RAD51B有三个复发断点,包含5个不同的融合伙伴基因(CEP170、ENOX1、NPC2、ZFYVE26和PCNX)。


结果4:反复发生的DDR突变的蛋白结构建模


通过蛋白质结构分析和建模,检测了22个DDR基因中相对罕见的、反复发生的突变的潜在功能结果。这些突变包括MGMT、PARP1、TOP3A、BLM、ERCC2、HFM1、POLE、POLD1和POLQ,共有1380个独特的、罕见的、经常性的non-synonymous突变。这些突变大部分发生在domain接口或沿着solvent-accessible表面,被预测为具有强的不稳定性。另有小部分被预测为是具有强稳定性,因此可能通过限制蛋白构象变化进而影响功能。


POLE外切酶结构域突变与较高的突变负荷呈正相关,与SCNA负荷负相关。比较预测的强不稳定突变与非不稳定突变基因的突变和SCNA负荷评分。大多数预测的不稳定突变显示与较高的突变和SCNA或突变负荷分数呈正相关。许多基因在这两种负荷评分之间呈反向关系,例如,破坏稳定的POLB突变与较高的突变和较低的SCNA负荷相关,而破坏稳定的PARP1突变与较低的突变和较高的SCNA负荷相关。因此,预测的不稳定突变可能通过改变或废除DDR功能直接影响下游负荷分数。


图片

Figure 4. Rare, Recurrent DDR Gene Mutations  Differentially Alter Protein Structural  Stability


结果5:机器学习衍生的表达特征预测TP53失活


TP53功能的丧失在许多癌症类型中具有显著的功能后果,通过与基因组不稳定性相关的高SCNA负荷和高HRDscore对此进行衡量。采用癌症类型和突变负荷构造了TP53分类器预测失活状态,然后用它来分析具有相同数量TP53改变的癌症类型。所得到的分类器具有高度的敏感性和特异性。TP53分类器的个体权重识别出了10个最负权重的基因,其中9个是经确认的TP53靶基因。剩余的基因MPDU1可能位于TP53下游约80kb的位置,因此对TP53拷贝丢失很敏感。


图片

Figure 5. Machine Learning to Predict  TP53 -Inactivating Mutations in Cancer


结果6:DDR的改变与临床结果相关


与基于突变和表达的DDR足迹评分相比,基于sCNA的评分与生存结果的相关性更强。


此外,文章详细介绍了分析方法,同时还提供了HRR数据库链接里面有不同分类的详细说明,链接地址如下:

https://www.gsea-msigdb.org/gsea/msigdb/collections.jsp

https://www.mdanderson.org/documents/Labs/Wood-Laboratory/human-dna-repair-genes.html。


迈杰转化医学针对HRD检测的整体解决方案


HRDetectCDx是迈杰转化医学自主研发的一款HRD评分检测Panel,基于ChinaMap中国万人数据库筛选的41000+高质量单核苷酸多态性位点(Single Nucleotide Polymorphisins,SNPs),通过分析杂合性缺失(Loss of Heterozygosity,LOH)、端粒等位基因不平衡(Telomeric Allelic Imbalance,TAI)和大片段迁移(Large-scale State Transitions,LST)等,计算出基因组不稳定性评分(Genomic Instability Score,GIS)。除了HRD-score计算,同时还包括85个相关基因体细胞和胚系变异分析,可将接受PARP抑制剂治疗的获益人群最大化。


图片

Figure 6 HRDetectCDx检测内容


参考文献

[1] Eisen, J. A. , & Hanawalt, P. C. . (1999). A phylogenomic study of dna repair genes, proteins, and processes. Mutation Research, 435(3), 171-213.

[2] Ronen, A. , & Glickman, B. W. . (2001). Human dna repair genes. Environmental & Molecular Mutagenesis, 37(3), 241–283.

[3] Richard D. Wood Michael Mitchell John Sgouros。(2001). Human DNA Repair Genes.Science ,Vol. 291, Issue 5507, pp. 1284-1289.DOI: 10.1126/science.1056154.

[4] Lange, S., Takata, K. & Wood, R. DNA polymerases and cancer. Nat Rev Cancer 11, 96–110 (2011). https://doi.org/10.1038/nrc2998

[5] Knijnenburg, Theo A et al. (2018).Genomic and Molecular Landscape of DNA Damage Repair Deficiency across The Cancer Genome Atlas.Cell reports vol. 23,1 : 239-254.e6. doi:10.1016/j.celrep.2018.03.076


内容:生信中心宋文惠
编辑:Sally
校正:Chao.Z/Grace

咨询热线

400-007-1121

央视《匠心》栏目视角看迈杰转化医学