英國維康基金會桑格研究所的研究人員測序了560位乳腺癌患者的腫瘤和正常組織的全基因組,鑒定出93個驅動基因,以及與缺陷DNA修復和BRCA1及BRCA2功能相關的突變標簽(mutational signatures),揭示了乳腺癌的基因起源和驅動機制。相關研究于5月2日發表在《Nature》和《Nature Communications》上,是目前最全面的乳腺癌基因組分析。
發表在《Nature》的文章中,由桑格研究所主任Michael Stratton和癌癥基因組計劃負責人Serena Nik-Zainal領導的研究小組測序了556位女性和4位男性乳腺癌患者的腫瘤和正常組織基因組,另外還對部分患者進行了轉錄組測序、microRNA表達分析、基于陣列的拷貝數分析和甲基化數據分析。Stratton說,“這項迄今為止最大的單一類型癌癥研究告訴我們,乳腺癌中存在哪些基因變異以及它們在基因組中的發生位置。尋找癌癥間的基因變異對開發改進的療法至關重要。”
通過測序,研究人員發現了3,479,652個體細胞堿基替換,371,993個小型插入/缺失和77,695個重組,結合之前發表的另外772個乳腺癌基因組測序數據,發現了5個之前未知的驅動基因。研究人員共在93個基因中鑒定出1,628個可能的驅動突變。95%的基因組至少有一個驅動基因。10個最常見的突變基因是TP53, PIK3CA, MYC, CCND1, PTEN, ERBB2, the ZNF703/FGFR1 locus, GATA3, RB1和MAP3K1,占驅動基因的62%。
盡管研究人員鑒定出若干可能激活驅動基因的in-frame融合基因,他們發現復發性基因融合(recurrent gene fusions)很少表達。相反,一些基因CDKN2A, RB1, MAP3K1, PTEN, MAP2K4, ARID1B, FBXW7, MLLT4 和TP53的重組較為常見。
研究人員還分析了基因組的非編碼區。他們在PLEKHS1, TBC1D12和WDR74的啟動子中,以及長非編碼RNA MALAT1和NEAT1中發現了復發性突變(recurrent mutations)。
不同的突變過程產生不同類型的突變標簽。例如,有特定的突變標簽與紫外線輻射和吸煙引起的DNA損失相關。以前的研究已經基于堿基替換模式鑒定出了5個乳腺癌突變標簽。在這項研究中,研究人員利用數學模型來尋找癌癥基因組中的其他標簽,共發現了12個(包括前面所述的5個)。在另7個新發現的突變標簽中,5個在其他類型的癌癥中發現過,2個是第一次被發現。
接下來,研究人員又鑒定出了6個重組標簽。標簽1~3的特征是串聯重復。標簽3存在于91%的具有BRCA1突變的癌癥中,在基底細胞樣乳腺癌、三陰性乳腺癌和具有很高同源重組缺陷評分的乳腺癌中常見。重組標簽5的特征是出現小于100 kb的缺失。標簽2的特征是出現大于100kb缺失,在雌激素受體陽性乳腺癌中常見。560例病例中90例有BRCA1或BRCA2突變,其中60例為胚系突變,14例為體細胞突變。由于BRCA1和BRCA2缺陷的基因組僅與標簽3或5相關,研究人員表示,鑒定這些突變標簽是未來做診斷的基礎。
發表于《Nature Communications》的文章中,研究人員進一步地研究了突變標簽,鑒定與它們相關的突變過程。他們發現,一些標簽是年齡相關的,以胞嘧啶脫氨為主;一些標簽與APOBEC、錯配修復缺陷或同源重組缺陷相關;一些標簽的病因不明。歐洲分子生物學實驗室歐洲生物信息學研究所所長Ewan Birney領導了這一分析,他說,“基因改變和它們在癌癥基因組中的位置影響患者對治療的響應。這一研究帶給我們一種新的方式來描述乳腺癌的突變類型。”
參考文獻:
1. Landscape of somatic mutations in 560 breast cancer whole-genomesequences. Nature (2016) doi:10.1038/nature17676
2. The topography of mutational processesin breast cancer genomes. Nature Communications 7, doi:10.1038/ncomms11383