作物數(shù)據(jù)庫作為農(nóng)業(yè)科研領(lǐng)域的核心基礎(chǔ)設(shè)施,通過系統(tǒng)化整合遺傳、基因組、表型等多維數(shù)據(jù)形成資源庫,為農(nóng)業(yè)科研、遺傳資源保護、分子育種加速、表型 – 基因型關(guān)聯(lián)分析等研究提供了關(guān)鍵支撐。本文聚焦水稻、小麥、玉米、大豆四大作物,梳理其核心遺傳與基因組數(shù)據(jù)庫,旨在為農(nóng)業(yè)科研工作者提供全面的數(shù)據(jù)資源參考。
水稻數(shù)據(jù)庫
☆?國家水稻數(shù)據(jù)中心:提供水稻優(yōu)異品種、突變體、分子標(biāo)記、基因、QTL、品種、系譜等信息,以及水稻期刊、軟件服務(wù)等資源。
☆?水稻基因組注釋項目數(shù)據(jù)庫RGAP與水稻注釋計劃RAP:旨在提供水稻日本晴基因組的序列和注釋數(shù)據(jù)。該網(wǎng)站提供基因組序列和12條水稻染色體的注釋,基因的分布,或者根據(jù)基因名稱查找基因的功能和序列、下載數(shù)據(jù)或使用blast搜索同源基因。
☆?水稻基因組變異及其功能注釋的綜合數(shù)據(jù)庫RiceVarMap v2.0:提供了來自4,726個水稻種質(zhì)的測序數(shù)據(jù)中的17,397,026個基因組變異(包括14,541,446個SNP和2,855,580個小?INDEL)的精選信息,高質(zhì)量和完整的基因型數(shù)據(jù),變異的全面注釋,表型數(shù)據(jù)和?GWAS?結(jié)果,對功能基因定位,標(biāo)記開發(fā)的客戶非常友好。
☆?水稻功能基因組育種數(shù)據(jù)庫RFGB(v2.0):該數(shù)據(jù)庫整合了3024份水稻種質(zhì)資源的18M SNP、2.3M InDel、IRGSP所有基因單倍型和12種表型數(shù)據(jù),具有基因檢索、基因組變異可視化瀏覽、BLAST等功能,將表型數(shù)據(jù)和單倍型數(shù)據(jù)聯(lián)合分析,為挖掘基因有利單倍型提供數(shù)據(jù)支持。
☆?Oryzabase是一個綜合性水稻科學(xué)數(shù)據(jù)庫,包含大量水稻品系庫存信息,突變體信息,染色體圖譜,基因字典,水稻科學(xué)基礎(chǔ)知識。OryzaGenome是野生Oryza物種的基因組數(shù)據(jù)庫,為水稻研究提供了比較和進化的組學(xué)方法。
☆?水稻基因索引數(shù)據(jù)庫RGI:在這個數(shù)據(jù)庫里,亞洲稻的每一個基因都能輕松找到同源或相近的基因,以及追蹤其演變歷史。
☆水稻功能基因組表達數(shù)據(jù)庫RiceGE
☆?水稻基因表達庫RED:是一個基因表達譜存儲庫,對跨越整個水稻生長階段的組織進行?RNA-Seq?數(shù)據(jù)分析,涵蓋各種生物和非生物處理。
☆?水稻表達譜數(shù)據(jù)庫RiceXPro:針對水稻植物在自然田間條件下的整個生長過程、用各種植物激素處理的水稻幼苗以及通過激光顯微切割(LMD) 分離的特定細胞類型/組織,使用微陣列技術(shù)進行水稻轉(zhuǎn)錄組分析,旨在表征水稻中所有預(yù)測基因的表達譜。
☆?水稻多元表觀基因組數(shù)據(jù)的數(shù)據(jù)庫RiceENCODE:該數(shù)據(jù)庫收集了包括ChIP-seq,ATAC-seq, MNase-seq, FAIRE-seq, BS-seq, RNA-seq, ncRNA-seq, Hi-C和ChIA-PET?等水稻高通量數(shù)據(jù),可查詢不同品種、不同組織、不同染色體區(qū)段交互信息,兩兩基因之間交互網(wǎng)絡(luò)等。
小麥數(shù)據(jù)庫
☆?小麥基因組信息數(shù)據(jù)庫:由國際小麥基因組測序聯(lián)盟維護(IWGSC),可查找參考基因組序列、基因,BLAST,批量注釋等多個功能,可幫助科研工作者加速開發(fā)改良品種,為小麥基礎(chǔ)應(yīng)用科學(xué)提供支持。
☆?小麥組學(xué)數(shù)據(jù)在線平臺WheatOmic:實現(xiàn)了對多套麥族物種基因組、轉(zhuǎn)錄組、變異組、突變體庫外顯子組、表觀修飾組等大數(shù)據(jù)的可視化,并具有擬南芥/水稻-小麥同源基因鑒定、基因共表達網(wǎng)絡(luò)構(gòu)建、蛋白互作、轉(zhuǎn)錄因子結(jié)合位點分析等多個分析工具。
☆?小麥族同源基因數(shù)據(jù)庫TriticeaeGeneTribe:利用小麥族物種中已發(fā)表的基因組,對不同參考基因組間同源基因鑒定,構(gòu)建了小麥族同源基因數(shù)據(jù)庫。同時,數(shù)據(jù)庫具有基因功能查詢,GO富集分析,同源基因查詢,基因組區(qū)間共線性分析等功能。
☆?小麥蛋白質(zhì)組數(shù)據(jù)庫
☆?小麥及其祖先的基因組變異數(shù)據(jù)庫:適用于多套小麥及祖先種變異數(shù)據(jù)集的查詢,可對大規(guī)模樣本的VCF文件實現(xiàn)在線的快速檢索和分析可視化。
☆?小麥基因組變異與選擇信號數(shù)據(jù)庫WGVD:匯總了從968個面包小麥及其祖先中收集到的SNPs、indels,以及基于93個小麥全基因組重測數(shù)據(jù)的SNPs評估的小麥馴化和改良過程中的選擇特征。數(shù)據(jù)庫主要提供變異、基因組選擇信號搜索、基因組瀏覽和比對功能。
☆?小麥WheatCNVb數(shù)據(jù)庫:基于小麥CNVb新型分子標(biāo)記系統(tǒng),支持查詢小麥種質(zhì)資源的CNVb標(biāo)記,可視化CNVb指紋,并進行基于CNVb指紋的品種比較。
☆?利用整合基因調(diào)控網(wǎng)絡(luò)探索小麥功能基因的交互式平臺wGRN:提供了基因調(diào)控查詢、功能基因預(yù)測和QTG挖掘等十余個功能模塊,建立了小麥整合基因調(diào)控網(wǎng)絡(luò),實現(xiàn)了可持續(xù)整合大規(guī)模調(diào)控數(shù)據(jù)集的網(wǎng)絡(luò)化研究框架。
☆?異源六倍體小麥及其祖先的比較共表達網(wǎng)絡(luò)分析數(shù)據(jù)庫WheatCENet:集成了功能注釋,蛋白質(zhì)-蛋白質(zhì)相互作用、miRNAs,GO注釋、GSEA等工具能夠搜索和比較特定的功能共表達網(wǎng)絡(luò),識別其中聚集的基因的相關(guān)功能。
☆?小麥種質(zhì)資源血緣區(qū)間比較數(shù)據(jù)庫WheatCompDB:主要針對數(shù)據(jù)集中任意兩個樣本間的種質(zhì)資源血緣區(qū)間比較分析,支持基因組水平、染色體水平和局部區(qū)間水平下種質(zhì)資源網(wǎng)絡(luò)的構(gòu)建和挖掘。
玉米數(shù)據(jù)庫
☆?玉米基因組和遺傳分析平臺:數(shù)據(jù)庫包含了玉米的基因組序列、基因注釋、遺傳圖譜、突變體信息、表達數(shù)據(jù)、相關(guān)的文獻和研究工具。旨在支持玉米遺傳學(xué)和基因組學(xué)的研究,為科研工作者提供訪問和分析玉米的遺傳和基因組數(shù)據(jù)的平臺。
☆?玉米及其野生近緣種的基因組工程資源庫:包括玉米及其野生親屬禾本科的復(fù)雜性狀,稀有遺傳變異如何影響整體植物功能。
☆?玉米多組學(xué)基因網(wǎng)絡(luò)分析平臺:整合了701個轉(zhuǎn)錄組學(xué)數(shù)據(jù)和108個表觀基因組數(shù)據(jù),并研究了具有多維組學(xué)水平的不同條件網(wǎng)絡(luò)。MCENet?還提供?5?個網(wǎng)絡(luò)訪問分析工具包(即?Network Search、Network Remodel、Module Finder、Network Comparison?和?Dynamic Expression View)和多個網(wǎng)絡(luò)功能支持工具包。
☆?適應(yīng)玉米多組學(xué)時代的綜合數(shù)據(jù)庫:整合了來自于同一玉米群體的基因組、轉(zhuǎn)錄組、表型組、代謝組、表觀基因組、遺傳變異以及遺傳定位結(jié)果等多組學(xué)數(shù)據(jù),同時收錄了多個玉米基因組,可以進行比較基因組、共線性分析、表達聚類、遺傳變異基因分型、連鎖圖譜、定位結(jié)果、組蛋白修飾以及甲基化等多組學(xué)數(shù)據(jù)進行檢索和分析,實現(xiàn)在不同組學(xué)數(shù)據(jù)之間進行跳轉(zhuǎn)。
☆?擬南芥和玉米蛋白質(zhì)組數(shù)據(jù)庫:為通過實驗鑒定擬南芥和玉米中的蛋白質(zhì)提供了集成資源。內(nèi)部BLAST比對鏈接玉米和擬南芥信息,實驗鑒定基于細胞類型特異性蛋白質(zhì)組或特定亞細胞蛋白質(zhì)組(例如葉綠體,類囊體,核苷)和總?cè)~蛋白質(zhì)組樣品的內(nèi)部質(zhì)譜(MS)。
☆?利用玉米單倍型標(biāo)簽多態(tài)性分析工具:HTP數(shù)據(jù)庫(HTPdb):該數(shù)據(jù)庫覆蓋了育種中常用的3,587個重要玉米自交系,其中包括172,921個非冗余的HTP等位基因變異,提供了豐富的單倍型標(biāo)簽資源。同時,基于HTP標(biāo)記的特點,研究人員在HTPTools中集成了智能區(qū)塊數(shù)據(jù)填充算法,當(dāng)僅需獲取少量HTP標(biāo)記的基因型時,可以通過該功能快速地獲取對應(yīng)區(qū)塊的完整數(shù)據(jù)。
☆?玉米網(wǎng)絡(luò)數(shù)據(jù)庫MaizeNetome:其中包含從基因組到轉(zhuǎn)錄組、翻譯組和蛋白質(zhì)組的整個遺傳傳遞。多組學(xué)整合網(wǎng)絡(luò)圖譜通過ChIA-PET整合基因組相互作用,包括跨根、葉、穗、?SAM和其它31個組織或發(fā)育階段mRNA-seq、circRNA-seq?的轉(zhuǎn)錄組共表達網(wǎng)絡(luò),跨?21?個不同組織/階段Ribo-seq?數(shù)據(jù),?B73?材料8?個不同組織的酵母雜交蛋數(shù)據(jù)。數(shù)據(jù)庫可以幫助輔助QTL定位,并系統(tǒng)剖析農(nóng)藝性狀的可能分子機制,為快速基因克隆和高效的網(wǎng)絡(luò)分析鋪平道路。
☆?全基因組范圍的玉米基因輔助功能網(wǎng)絡(luò)數(shù)據(jù)庫MaizeNet:是通過集成?21?個組件網(wǎng)絡(luò)構(gòu)建的,其中每個網(wǎng)絡(luò)都是從不同的組學(xué)數(shù)據(jù)中推斷出來的。 通過整合異構(gòu)數(shù)據(jù),MaizeNet?提供了玉米遺傳結(jié)構(gòu)的全面視圖,為特定生物過程確定候選基因的優(yōu)先級??梢岳?MaizeNet?中實現(xiàn)的優(yōu)先級服務(wù)來生成新的功能假設(shè),縮小候選基因的范圍,并確定該功能的新基因。
☆?中國玉米品種系譜數(shù)據(jù)庫:收錄自交系及品種信息10000余條,涉及自交系1218個,雜交種7823個。該數(shù)據(jù)庫實現(xiàn)了品種信息檢索、系譜追溯、子代查詢、定制化查詢、用戶上傳及糾錯系譜信息等功能,便于中國玉米育種家及科研工作者快捷查詢玉米自交系及品種的信息及系譜關(guān)系。
大豆數(shù)據(jù)庫
☆?水稻、小麥和大豆的分子育種資源庫:這是一個集成數(shù)據(jù)庫,收集了群體測序、種質(zhì)資源、表型和各種基因組數(shù)據(jù)。
☆?大豆基因組學(xué)和分子生物學(xué)數(shù)據(jù)庫:為大豆研究者提供了大量的數(shù)據(jù)和工具,以支持大豆的遺傳學(xué)、基因組學(xué)和育種研究。用戶可以通過SoyBase查找大豆的基因組信息、遺傳資源、表型數(shù)據(jù)等,并利用其中的分析工具進行數(shù)據(jù)挖掘和可視化。
☆?大豆種質(zhì)資源組學(xué)數(shù)據(jù)庫:用戶可提供離散值的表型數(shù)據(jù)來幫助用戶識別用于育種或遺傳研究的“有用”種質(zhì)資源,實現(xiàn)了2K-SG的33個數(shù)量性狀與9個質(zhì)量性狀的共享;用戶可以利用SoyFGB或未公開表型數(shù)據(jù)來實現(xiàn)表型和單倍型變異的相關(guān)性在不同基因組分辨率下的在線解析;獲得基因組作圖定位與表型性狀相關(guān)區(qū)域,使用?“搜索”和“瀏覽”模塊,用戶可以獲取2K-SG?的基因組變異,用于實驗驗證。
☆?大豆多組學(xué)數(shù)據(jù)庫SoyMD:共提供了8個組學(xué)模塊以方便用戶瀏覽和分析多組學(xué)數(shù)據(jù),包括基因組、轉(zhuǎn)錄組、表觀基因組、表型組、變異組、工具、下載和幫助模塊。
☆?大豆多組學(xué)數(shù)據(jù)庫SoyOmics:從基因組、變異組、轉(zhuǎn)錄組、表型組等不同層面整合了大豆相關(guān)數(shù)據(jù)集,實現(xiàn)了不同層次組學(xué)數(shù)據(jù)的交互查詢和聯(lián)合比較分析。數(shù)據(jù)庫目前收錄了多個大豆品系的基因組組裝,注釋數(shù)據(jù),以高質(zhì)量的ZH13作為參考基因組,對2898份材料的全基因組測序數(shù)據(jù)進行了全基因組序列變異檢測,鑒定到約3800萬條SNP/INDEL變異數(shù)據(jù),提供了來自大豆泛基因組分析的約55萬條結(jié)構(gòu)變異數(shù)據(jù)以及基于結(jié)構(gòu)變異構(gòu)建的圖泛基因組。收錄了多個品系不同組織時期的表達數(shù)據(jù)。數(shù)據(jù)庫針對115個表型多年多點測定的約2.7萬條表型記錄進行了本體注釋和歸類,并將表型數(shù)據(jù)與變異數(shù)據(jù)進行關(guān)聯(lián)。除以上組學(xué)數(shù)據(jù)外,數(shù)據(jù)庫同時提供了甲基化測序數(shù)據(jù),Soy40K大豆芯片數(shù)據(jù)。
☆?Soybean Expression Atlas的升級版本其中包含?5481?個公開可用的?RNA-seq?樣本的轉(zhuǎn)錄本和基因級轉(zhuǎn)錄本豐度矩陣。
☆?iSoybean:收集了EMS誘變的大豆突變種群,并利用全基因組測序技術(shù)對1,044個突變系中的變異進行了詳細表征。該網(wǎng)站致力于提供關(guān)于大豆突變體的詳盡信息,并通過種子庫分發(fā)這些突變體,促進其在功能基因組學(xué)研究領(lǐng)域的快速應(yīng)用。
☆?SoyDNGP:構(gòu)建了一個基于預(yù)測模型SoyDNGP的大豆表型預(yù)測平臺,為基于基因變異的作物表型預(yù)測研究提供了創(chuàng)新的工具和方法。
百邁客生物深耕物種多組學(xué)數(shù)據(jù)庫建設(shè),已為眾多科研機構(gòu)與高校提供從數(shù)據(jù)存儲到分析挖掘的全流程解決方案,已成功應(yīng)用,取得了顯著的研究成果。無論是物種保護、生態(tài)監(jiān)測還是遺傳育種,我們的數(shù)據(jù)庫都為其提供了強有力的數(shù)據(jù)支持,助力科研人員攻克一個又一個科學(xué)難題。
部分合作案例
百邁客生物致力于為您提供最準確、最全面的作物數(shù)據(jù),將持續(xù)更新作物育種動態(tài)、種植技術(shù)及市場資訊,歡迎科研工作者提出數(shù)據(jù)需求與合作建議,共同推動農(nóng)業(yè)科技創(chuàng)新。