Pore-C是指將染色質(zhì)構(gòu)象捕獲技術(shù)與Nanopore長(zhǎng)讀長(zhǎng)測(cè)序技術(shù)結(jié)合,無(wú)需擴(kuò)增直接檢測(cè)多向染色質(zhì)交互信息的一種新技術(shù)。該技術(shù)除了像Hi-C一樣能確定成對(duì)基因組結(jié)構(gòu),還可以直接測(cè)量細(xì)胞內(nèi)同時(shí)相互作用的多個(gè)DNA區(qū)域互作信息(higher-order)。
通過(guò)甲醛將基因組DNA與組蛋白交聯(lián),保持相互作用位點(diǎn)的空間鄰近性。鄰近連接后進(jìn)行限制性酶切。將交聯(lián)、相互作用的片段連在一起,這些片段經(jīng)過(guò)大小選擇和文庫(kù)制備后基于Nanopore測(cè)序平臺(tái)進(jìn)行長(zhǎng)片段測(cè)序。
Pore-C reads與參考基因組比對(duì),以標(biāo)識(shí)單獨(dú)的對(duì)齊;篩選每個(gè)比對(duì)序列,保留橫跨大部分序列的最小片段合集。通過(guò)參考序列模擬酶切,將每個(gè)序列部分指定到一個(gè)限制性片段。將與Pore-C序列相關(guān)聯(lián)的對(duì)齊集稱為多向(multi-way)連接,并將與連接關(guān)聯(lián)的片段數(shù)作為其順序。
研究者初步組裝了水稻Azucena品種基因組,包含527個(gè)contigs,contigN50為3.7Mb,并使用30 Gb(~75x)的Pore-C reads進(jìn)一步增加組裝的連續(xù)性。組合后的ScaffoldN50≥29.6 Mb(圖a)。獲得的最大的12個(gè)scaffolds接近參考基因組整個(gè)染色體的長(zhǎng)度。圖b c、d e分別顯示使用Pore-C數(shù)據(jù)搭建前后的dot-plot和contact map,圖中可知基因組得到明顯優(yōu)化。
研究者使用130 Gb Nanopore reads組裝了人類基因組NA24385,contigN50達(dá)到10.4 Mb,并通過(guò)使用Pore-C進(jìn)行scaffolding,進(jìn)一步提高了人類基因組組裝的連續(xù)性,使得scaffoldN50高達(dá)98.6 Mb。加入Pore-C之前可以看到許多非對(duì)角線特征,表明裝配不是最佳的(圖c, Chr. 4所示)。在Pore-C搭建之后,得到了一個(gè)更優(yōu)的裝配,僅三個(gè)scaffold變覆蓋整條染色體。