DNA不僅存儲遺傳序列信息,同時還有表觀修飾信息,這兩者都對我們理解生物學至關重要。通過高通量測序測定DNA堿基G、C、T和A序列的方法已經比較成熟,近年來針對DNA中的表觀遺傳信息的檢測方法也有了很大的進展,比如通過堿基轉換的方法區(qū)分未修飾的C與修飾的5-甲基胞嘧啶(5mC)或5-羥甲基胞嘧啶(5hmC)。這些方法包括基于亞硫酸氫鹽的方法,如全基因組亞硫酸氫鹽測序(WGBS)和無亞硫酸氫鹽方法,如酶甲基測序(EM-seq)和TET輔助的吡啶硼烷測序等。但是目前的DNA測序方法大多數(shù)只能解決序列信息或表觀修飾信息中的一種,缺乏將兩者同時測定的方法,因此最終獲取的DNA信息均布完整。盡管其中一些方法可以通過獨立操作、并行建庫等工作流程和測序來獲得完整的信息,但是這可能會增加樣本需求、成本和時間。此外,合并不同的數(shù)據(jù)庫也很困難,會導致額外的測量誤差和信息覆蓋缺失。
為了解決DNA測序過程中序列信息和表觀信息的統(tǒng)一性,2023年2月6日,來自劍橋大學的Shankar Balasubramanian和來自劍橋Epigenetix公司的Joanna D. Holbrook合作在Nature Biotechnology上以Article形式發(fā)表了題為Simultaneous sequencing of genetic and epigenetic bases in DNA的文章,提出了一種可以同時在一個樣品中檢測DNA序列信息和表觀修飾信息的方法。
研究人員首先開發(fā)了一種Five-letter seq的方法(如下圖),該方法不僅可以讀取常規(guī)G、C、T和A序列,同時還能讀取包含修飾胞嘧啶信息(包含5mC和5hmC)。該方法的原理是創(chuàng)造性地使用了雙堿基編碼系統(tǒng),通過兩種堿基的組合解碼一種序列或修飾信息,這個系統(tǒng)最多可以對多達16個狀態(tài)的DNA進行明確的解碼。具體地操作流程如下:樣本DNA首先通過超聲破碎,然后在兩端連接上短的DNA發(fā)夾序列形成啞鈴狀DNA。然后,啞鈴狀DNA被拆分成單鏈,通過DNA聚合酶3'端延伸作用合成互補鏈,此時互補鏈是沒有表觀遺傳修飾的,而原始樣本DNA鏈與其互補鏈連接形成新的發(fā)夾結構。然后將測序接頭連接到發(fā)夾結構DNA的末端。接下來利用TET甲基胞嘧啶雙加氧酶2將5mC氧化為5hmC或5fC或5caC,然后通過β-糖基轉移酶將所有5hmC進行糖基化反應,經過這樣處理之后ModCs(5mC和5hmC)被保護起來不能進行脫氨反應。未受保護的C通過APOBEC3A胞嘧啶脫氨酶(A3A)作用被脫氨轉變?yōu)槟蜞奏ぃ詈髸蛔x取為T。然后加入UvrD解旋酶,得到A3A作用的單鏈DNA底物。脫氨作用后雙鏈DNA不再完全互補,可以顯著降低雙鏈穩(wěn)定性,因此可以很容易地通過聚合酶鏈式反應(PCR)進行擴增。最后在DNA鏈兩端加上測序引物,其中read 1 (P7引物)是原始鏈,read 2 (P5引物)是復制鏈。讀數(shù)據(jù)是成對對齊的,因此read 1與它的互補鏈read 2匹配。通過計算解析兩個reads的同源殘基以產生單個遺傳或表觀遺傳字母。最終得到5種模式的遺傳信息表,剩余的11種非允許配對(標記為N)在解析的讀取和讀取本身時被保留下來,這樣可以使得最終產生最小的信息損失和高精度的讀取級別。
Five-letter seq
為了驗證Five-letter seq的準確性,研究人員將這種方法和WGBS和EM-seq比較,發(fā)現(xiàn)Five-letter seq不僅展現(xiàn)了很好的堿基準確性,同時也對DNA表觀修飾具有高精度的檢測效率。
之后,研究人員還提供了一種Six-letter seq的方法,在Five-letter seq的基礎上,加入甲基復制(methyl-copy)步驟,利用DNMT5將5mC從原始鏈復制到互補鏈。最終5hmC受到糖基化保護,不能被復制。最終Six-letter seq可以得到具有6種種模式的遺傳信息表,且通過測序驗證可以很好地區(qū)分出C、5mC和5hmC(如下圖)。
Six-letter seq
綜上所述,研究人員提出了一個單堿基分辨率測序方法,能夠再一個樣品中同時完成DNA堿基測序和兩個最常見的胞嘧啶修飾測序。該方法準確性高,需要起始DNA投入量低,且具有簡單的操作流程和分析步驟。序列信息和表觀信息的同時讀取使得存儲在基因組中的遺傳信息了解更完整,在整個生物醫(yī)學領域都將會有新的應用價值。
參考文獻
1. Frommer, M. et al. A genomic sequencing protocol that yields a positive display of 5-methylcytosine residues in individual DNA strands. PNAS 89, 1827–1831 (1992).
2. Vaisvila, R. et al. Enzymatic methyl sequencing detects DNA methylation at single-base resolution from picograms of DNA. Genome Res. 31, 1280-1289 (2021).
3. Liu, Y. et al. Bisulfite-free direct detection of 5-methylcytosine and 5-hydroxymethylcytosine at base resolution. Nat. Biotechnol. 37, 424–429 (2019).
4. Füllgrabe, J. et al. Simultaneous sequencing of genetic and epigenetic bases in DNA. Nat Biotechnol (2023).