Pore-C是指將染色質(zhì)構(gòu)象捕獲技術(shù)與Nanopore長讀長測序技術(shù)結(jié)合,無需擴增直接檢測多向染色質(zhì)交互信息的一種新技術(shù)。該技術(shù)除了像Hi-C一樣能確定成對基因組結(jié)構(gòu),還可以直接測量細(xì)胞內(nèi)同時相互作用的多個DNA區(qū)域互作信息(higher-order)。
通過甲醛將基因組DNA與組蛋白交聯(lián),保持相互作用位點的空間鄰近性。鄰近連接后進行限制性酶切。將交聯(lián)、相互作用的片段連在一起,這些片段經(jīng)過大小選擇和文庫制備后基于Nanopore測序平臺進行長片段測序。
Pore-C reads與參考基因組比對,以標(biāo)識單獨的對齊;篩選每個比對序列,保留橫跨大部分序列的最小片段合集。通過參考序列模擬酶切,將每個序列部分指定到一個限制性片段。將與Pore-C序列相關(guān)聯(lián)的對齊集稱為多向(multi-way)連接,并將與連接關(guān)聯(lián)的片段數(shù)作為其順序。
研究者初步組裝了水稻Azucena品種基因組,包含527個contigs,contigN50為3.7Mb,并使用30 Gb(~75x)的Pore-C reads進一步增加組裝的連續(xù)性。組合后的ScaffoldN50≥29.6 Mb(圖a)。獲得的最大的12個scaffolds接近參考基因組整個染色體的長度。圖b c、d e分別顯示使用Pore-C數(shù)據(jù)搭建前后的dot-plot和contact map,圖中可知基因組得到明顯優(yōu)化。
研究者使用130 Gb Nanopore reads組裝了人類基因組NA24385,contigN50達(dá)到10.4 Mb,并通過使用Pore-C進行scaffolding,進一步提高了人類基因組組裝的連續(xù)性,使得scaffoldN50高達(dá)98.6 Mb。加入Pore-C之前可以看到許多非對角線特征,表明裝配不是最佳的(圖c, Chr. 4所示)。在Pore-C搭建之后,得到了一個更優(yōu)的裝配,僅三個scaffold變覆蓋整條染色體。