小结 : 1) 通过100例去势抵抗性前列腺癌转移灶全基因组、全甲基化组、全转录组测序,发现了新的驱动基因改变。这些改变只有通过整合的全基因组方法才能检测到。 2) 建立CMP甲基化分子分型(CpG methylator phenotype),22%肿瘤TET2, DNMT3B, IDH1和BRAF高甲基化区域和体细胞突变与CMP分型相关。 3)良性前列腺癌、局部前列腺癌、转移性趋势抵抗性前列腺癌DNA甲基化图谱明显差异,提示甲基化作为肿瘤进展程度筛查指标的可能性。 4)前列腺癌驱动基因AR, MYC和ERG基因间区的甲基化修饰和RNA表达显著相关。 5)第一个转移性前列腺癌多组学大型综合研究,全面概述甲基化在转移性去势抵抗性前列腺癌中的重要调控作用。 虽然DNA甲基化是基因表达的关键调控因子,但转移型癌症的全基因组甲基化状况从未被检测。通过对100例抗去势前列腺转移瘤的WGBS与WGS和RNA-seq,我们发现了影响驱动基因的改变,而这些改变只能通过整合WGS的方法检测到。值得注意的是,我们观察到22%的肿瘤表现出一种新的表观基因组的亚型,这种亚型与TET2、DNMT3B、IDH1和BRAF中的高甲基化和体细胞突变有关。我们还鉴定了部分基因间区,其甲基化与致癌驱动基因如AR、MYC和ERG的表达量相关。最后,我们表明在癌症发展过程中差异甲基化优先出现在体细胞突变热点和潜在的调控区域。本研究是在转移性肿瘤中,整合了全基因组、全基因甲基和全转录组测序的进行分析,全面概述了甲基化在转移性抗去势前列腺癌中的重要调控作用。 胞嘧啶残基DNA甲基化是一种普遍存在的表观基因组调控机制。DNA甲基转移酶在鸟嘌呤(CpG二核苷酸)附近的胞嘧啶核苷酸的5碳上加一个甲基,生成5mC核苷酸。除了富含CpG的低甲基化区域(HMRs)外,大多数CpG二核苷酸都被甲基化,这些区域被称为islands, shores (±2u2009kb around islands) and shelves (± 2u2009kb around shores4). 这些区域经常位于基因调控位点,如启动子或增强子。异常的甲基化与肿瘤发生有关,并且肿瘤和良性组织之间的甲基化的差异已经在许多肿瘤类型中被报道。尽管肿瘤中CpG岛的高甲基化也有所报道,但肿瘤细胞在CpG岛的甲基化经常比正常细胞少。【本文研究关于肿瘤中低甲基化区域与癌症致癌基因影响】 每个样本的HMR总数从24,388到85,474。样本间的变异多发生在启动子和CpG岛、shores , shelves区间外,主要发生在基因body和调控区域,如转录因子结合位点,增强子区域,抑制子区域。HMR越多的肿瘤,基因组拷贝数改变频率明显更高。 DNA甲基化主要发生在基因启动子区域的CpG岛。然而,在97,747 个 recurrent HMR (rHMRs)中,有74%位于CpGislands, shores,shelves 之外。我们推断recurrent 基因间的HMRs可能与调控位点有关。事实上,88% recurrent的HMR位点与假定的调节区域重叠。对rHMRs进行无监督的聚类,确定了具有独特模式的甲基化肿瘤亚群。其中有一个cluster包括以前被诊断为治疗诱发的小细胞神经内分泌癌的肿瘤(t-SCNC),此癌症特征是AR信号减少,神经内分泌标记蛋白表达升高和明显的甲基化特征。我们还鉴定了一种新的mCRPC亚型(图1b),在rHMRs中甲基化水平显著高于其他所有簇和较少的HMR. 这些肿瘤在CpGislands, shores,shelves上均具有较少的HMR,被认为 CpG methylator phenotype (CMP)。通过聚类重采样表明聚类结果稳定性。CMP肿瘤很少有ETS家族相关的基因融合。CMP亚型与活检的解剖部位无显著相关性。一个包含所有复发低甲基化位点、良性前列腺和原发性前列腺肿瘤样本的t分布随机邻居包埋图显示,通过t-SNE可视化显示 CMP肿瘤、良性前列腺肿瘤和t-SCNC肿瘤形成单独的簇。 一些CMP肿瘤在TET2、IDH1和BRAF中存在互斥突变。与非CMP肿瘤相比,CMP肿瘤中TET2、IDH1、BRAF和DNMT3B突变富集<br />与先前在肿瘤中观察到的高甲基化表型一致,并不是所有的CMP肿瘤都有一个某个突变的基因,其可以影响甲基化过程。除DNMT3B和TET2外,DNMT和TET家族基因均未发现体细胞突变。在CMP或非CMP组中,肿瘤纯度与明显的甲基化模式无关。 很大区域的表观遗传激活和抑制是指在PCa中,由于表观遗传的一致性变化,如组蛋白修饰或DNA甲基化,导致含有多个基因的基因组区域同时被激活或抑制的现象。我们确定了14个候选的远程相互作用,其中两个(7p15.2和16q13)与之前确定的远程表观遗传沉默区域重叠。 部分甲基化区域(PMDs)是甲基化不完全缺失的基因组区域。PMD频率与HMR频率呈中度相关。然而,在良性前列腺、原发性前列腺癌和mCRPC样本中,含有PMDs的基因组比例(21% - 61%)没有显著差异。但与良性前列腺组织相比,原发性前列腺癌和mCRPC中PMDs的甲基化水平较低。在mCRPC中,基因组PMD比例与肿瘤纯度(P = 0.68)、总突变数(P = 0.30)或拷贝数改变百分比没有显著相关性。和乳腺癌中一样,发现PMD区域比基因组非PMD 区域,有更高的突变风险。 接下来,我们确定了DNA甲基化谷(DMVs),即与激活组蛋白标记H3K4me3或抑制组蛋白标记H3K27me3相关的,区间很宽的低甲基化区域。mCRPC样品中DMVs的数量从几百个到超过20,000个不等。H3K27me3相关的DMVs甲基化倾向于动态变化,多硫复合体在维持DMVs的抑制状态发挥重要作用。DMV频率较低的肿瘤中,DMVs与H3K4me3更加相关,但存在很多DMVs的肿瘤中,H3K4me3和H3K27me3信号的比例几乎相等。 研究表明,高表达基因的通常启动子处于低甲基化,基因body处于高甲基化。启动子区域甲基化与基因表达负相关,而基因body甲基化呈现正相关。我们鉴定了与10 kb以内与基因表达相关的rHMRs,并将这些表达相关的低甲基化区域HMRs命名为eHMRs。负相关的eHMRs(70%)主要位于转录起始位点(TSS);最强烈的正相关(总数的30%)在基因体的3端,这和之前研究类似。为了研究远端调控元件,我们拓宽了EHMR搜索范围(1Mb)。通过在原发性前列腺肿瘤中H3K27ac峰来确定候选增强子。 在FDR设定为0.05下,10412个基因至少与一个增强子关联,11928个基因至少与一个EHMR关联。研究表明距离TSS距离越近,甲基化与基因表达关系越紧密。 我们发现,与前列腺良性样本相比,mCRPC中雄激素关键应答基因,包括AR、KLK3(编码前列腺特异性抗原)、NKX3-1、FOLH1(编码前列腺特异性膜抗原)、SCHLAP1和PIK3CA,均表现出启动子低甲基化。与前列腺良性样本相比,我们在mCRPC肿瘤中未观察到肿瘤抑制子TP53或RB1的启动子高甲基化。同时,许多先前报道的高甲基化前列腺癌基因(例如,GSTP1),在mCRPC中也是差异甲基化区域。 许多基因具有PCa特异性表达的特征,但是基因组序列没有改变。为了检测甲基化影响pca特异性基因疾病特异性表达的模型,我们进行了无偏倚分析,比较了所有基因的eHMR相关强度及其表达变异性。与其他基因相比,PCa 特异性表达的基因与甲基化有更强的关联。 DNA甲基化可能和体细胞突变协同改变基因表达量。51,708个基因中的15,014个基因表达与局部DNA拷贝数改变、突变或结构变异显著相关(29%),与10,118个基因的局部甲基化显著相关(19.5%)。在10118个基因的表达与甲基化相关的基因中,4735个基因与甲基化和突变同时相关,5383个基因仅与甲基化相关。甲基化可以提升基因表达预测的模型。部分AR相关的基因,表现出不受DNA改变影响,而受到甲基化影响,比如KLK3 ,NKX3-1。这一发现支持了甲基化在mCRPC中雄激素通路激活中的作用。 我们和其他人之前已经确定了一个远端AR增强子区域,其中DNA拷贝数扩增与AR表达升高相关。我们在AR附近发现了多个eHMRs,包括AR启动子、先前鉴定的AR增强子和AR的上下游位点。尽管AR promoter 在其他组织中都处于低甲基化。但是鉴定出来的eHMR 只是在mCRPC 中低甲基化,在原发性PCa,和良性肿瘤中并未发现。7个eHMR中的5个与H3K27ac或HOXB13,FOXA1,AR或ERG的结合位点共定位。此外,AR和ERG ChIA PET数据表明,许多基因座之间存在长程染色质相互作用,这支持了这些基因座之间的物理相互作用的可能性。在基于eHMR数量预测AR表达的线性模型中,AR表达与低甲基化eHMR基因座数量呈正相关。 在81%的mCRPC样品中会出现AR gene body或上游增强子的拷贝数扩增。扩增的eHMR基因座数AR表达呈正相关。这些数据与一个模型相一致,在这个模型中,雄激素剥夺治疗的选择性压力有利于多个增强因子的大量扩增,从而驱动mCRPC中的AR表达。在非t- scnc, mCRPC样本中,低甲基化区域是局部存在的,eHMR区域低甲基化和拷贝数关系不密切。 大约一半的前列腺癌存在由ERG编码的致癌转录因子过表达定义。在PCa中,ERG表达量是可以忽略的,除非ERG启动子被融合基因激活。ERG主要的融合基因是ar调控的基因TMPRSS2,融合使TMPRSS2启动子接近ERG基因体,将ERG转化为ar驱动的基因。融合使TMPRSS2启动子接近ERG基因体,将ERG转化为ar驱动的基因。在TMPRSS2 ERG融合阳性肿瘤中,ERG表达水平差异很大,从AR表达水平和突变状态预测ERG表达的线性模型拟合不理想。我们推测,当融合存在时,TMPRSS2启动子或上游区域的甲基化可能影响ERG的表达。我们在TMPRSS2上游识别了与HOXB13、FOXA1、AR或ERG的TFBS共定位的rHMRs。这些位点的低甲基化频率在融合阳性和融合阴性样本中是相似的。然而,仅在融合阳性样本中,这些位点的甲基化与ERG表达呈负相关,这与TFBS甲基化调节下游融合基因表达的模型一致。只有在融合阳性肿瘤中,TMPRSS2上游所有rHMRs的甲基化显著提高了ERG表达量的预测。这些数据表明,TMPRSS2上游调控区域的甲基化导致了该亚型产生。 在38%的mCRPC样本中癌基因MYC扩增。MYC基因拷贝数扩增与MYC表达呈中度相关。据报道,基因PVT1下游的远端增强子通过物理DNA DNA相互作用调节MYC。VCaP ChIA PET数据显示PVT1与MYC之间存在DNA相互作用。我们在MYC启动子和PVT1中观察到与MYC表达相关的rHMRs。这些rHMR改进了预测MYC表达的模型的拟合度,该模型优于仅使用MYC拷贝数的模型。增强子甲基化已被证明调节增强剂的活性,这为这一观察提供了一个合理的解释。总之,这些发现支持了甲基化可能影响关键PCa驱动的活动的模型。 在比较良性前列腺癌和原发性前列腺癌,以及原发性前列腺癌和mCRPC时,我们使用了公开的WGBS数据和局部PCa样本11来识别差异甲基化区域(DMRs)。原发性前列腺癌的甲基化程度明显低于良性前列腺癌。此外,mCRPC样品的甲基化程度明显低于原发性PCa。在良性PCa和原发性PCa的DMRs中,55%与原发性PCa和mCRPC的DMRs重叠。 癌症中的整体低甲基化可能导致基因组不稳定。当比较mCRPC 差异甲基化位点,发现HMR区域有很高的体细胞突变率。DMR内部的突变率比外部高58.5%(每Mb有6.77和4.28个突变),这表明基因组的某些区域更频繁地受到突变和甲基化的影响。最后,我们测试了差异甲基化是否在整个基因组的调控区域优先发生。当我们检查推定的调控区域(以AR,ERG,FOXA1,HOXB13和H3K27ac ChIP-seq标记)差异甲基化时,与良性前列腺组织相比,HMR更容易在调控区域进行富集。 在这里,我们对100个肿瘤样本和10个配对的良性癌旁样本,并对这些样本进行了较深的WGS和RNA-seq,对含WGBS的mCRPC的甲基化进行了全球分析。这些数据确定了一个新的mCRPC的表观遗传亚型,AR的新的基因间调控区域,以及在AR、ERG、MYC和其他重要的PCa驱动因子调控中体细胞和表观改变之间的相互作用。我们还证明了整体甲基化改变可以用来区分 良性前列腺癌、原发性前列腺癌和mCRPC。我们发现体细胞突变和假定的调控区域经常位于差异低甲基化区域。 虽然PCa的基因组和转录组亚型已经被报道,但我们确定了一个新的mCRPC的表观遗传CMP亚型,其特征是在CpGislands, shores,shelves内外都存在高甲基化。我们认为这种现象类似于在其他肿瘤类型中描述的CpG岛甲基化表型(CIMP)。mCRPC CMP亚型富集了TET2、BRAF和IDH1的突变,这些突变在其他癌症类型中与CIMP亚型相关。在癌症基因组图谱中,IDH1突变与CpG岛高甲基化相关。目前的研究不能确定我们观察到的任何突变是否会驱动甲基化变化。先前对TET2和DNMT3B突变的实验研究表明,它们的影响可能因组织类型和基因组区域而不同,需要使用表型研究来阐明CMP表型的机制。mCRPC CMP亚型具有潜在的治疗意义,因为甲基化抑制剂如5-azacytidine和5-aza-2-脱氧胞苷是FDA批准的抗肿瘤药物。体外数据和临床数据表明,高甲基化肿瘤可能受益于这些治疗. 我们的结果强调了癌症相关的低甲基化在mCRPC中致癌驱动基因过表达中的重要性。AR是前列腺癌的主要驱动因子和治疗靶点。近年来的研究发现了AR基因body的扩增和AR上游的增强子. 我们发现,在这些假定的AR增强子区域中,基因间eHMRs与mCRPC中的AR表达量相关。许多假定的增强子区域与转录因子结合位点重叠。这些增强子距离AR基因较远,但该区域呈现复杂的DNA loop,可能使这些位点接近AR启动子。MYC PVT1相互作用是远程顺式增强子和甲基化相互作用的另一个例子.已知在肿瘤中,远端增强子可激活癌基因,这些数据强调了在mCRPC发病机制中,甲基化、转录因子、DNA改变和基因组三维结构之间的复杂相互作用。 因为转移性Pca(mCRPC)和原发性PCa的WGBS样本少,甲基化差异研究受到了限制,未来的工作将整合大量的原发性PCa样本中的WGS、WGBS和RNA-seq数据,这将有助于更稳健地分析晚期疾病期间DNA甲基化变化的方式,并更好地捕获原发性PCa的分子异质性。对其他mCRPC队列的数据整合,将使我们了解稀有的突变对甲基化的影响。