作物數據庫作為農業(yè)科研領域的核心基礎設施,通過系統(tǒng)化整合遺傳、基因組、表型等多維數據形成資源庫,為農業(yè)科研、遺傳資源保護、分子育種加速、表型 – 基因型關聯分析等研究提供了關鍵支撐。本文聚焦水稻、小麥、玉米、大豆四大作物,梳理其核心遺傳與基因組數據庫,旨在為農業(yè)科研工作者提供全面的數據資源參考。
水稻數據庫
☆?國家水稻數據中心:提供水稻優(yōu)異品種、突變體、分子標記、基因、QTL、品種、系譜等信息,以及水稻期刊、軟件服務等資源。
☆?水稻基因組注釋項目數據庫RGAP與水稻注釋計劃RAP:旨在提供水稻日本晴基因組的序列和注釋數據。該網站提供基因組序列和12條水稻染色體的注釋,基因的分布,或者根據基因名稱查找基因的功能和序列、下載數據或使用blast搜索同源基因。
☆?水稻基因組變異及其功能注釋的綜合數據庫RiceVarMap v2.0:提供了來自4,726個水稻種質的測序數據中的17,397,026個基因組變異(包括14,541,446個SNP和2,855,580個小?INDEL)的精選信息,高質量和完整的基因型數據,變異的全面注釋,表型數據和?GWAS?結果,對功能基因定位,標記開發(fā)的客戶非常友好。
☆?水稻功能基因組育種數據庫RFGB(v2.0):該數據庫整合了3024份水稻種質資源的18M SNP、2.3M InDel、IRGSP所有基因單倍型和12種表型數據,具有基因檢索、基因組變異可視化瀏覽、BLAST等功能,將表型數據和單倍型數據聯合分析,為挖掘基因有利單倍型提供數據支持。
☆?Oryzabase是一個綜合性水稻科學數據庫,包含大量水稻品系庫存信息,突變體信息,染色體圖譜,基因字典,水稻科學基礎知識。OryzaGenome是野生Oryza物種的基因組數據庫,為水稻研究提供了比較和進化的組學方法。
☆?水稻基因索引數據庫RGI:在這個數據庫里,亞洲稻的每一個基因都能輕松找到同源或相近的基因,以及追蹤其演變歷史。
☆水稻功能基因組表達數據庫RiceGE
☆?水稻基因表達庫RED:是一個基因表達譜存儲庫,對跨越整個水稻生長階段的組織進行?RNA-Seq?數據分析,涵蓋各種生物和非生物處理。
☆?水稻表達譜數據庫RiceXPro:針對水稻植物在自然田間條件下的整個生長過程、用各種植物激素處理的水稻幼苗以及通過激光顯微切割(LMD) 分離的特定細胞類型/組織,使用微陣列技術進行水稻轉錄組分析,旨在表征水稻中所有預測基因的表達譜。
☆?水稻多元表觀基因組數據的數據庫RiceENCODE:該數據庫收集了包括ChIP-seq,ATAC-seq, MNase-seq, FAIRE-seq, BS-seq, RNA-seq, ncRNA-seq, Hi-C和ChIA-PET?等水稻高通量數據,可查詢不同品種、不同組織、不同染色體區(qū)段交互信息,兩兩基因之間交互網絡等。
小麥數據庫
☆?小麥基因組信息數據庫:由國際小麥基因組測序聯盟維護(IWGSC),可查找參考基因組序列、基因,BLAST,批量注釋等多個功能,可幫助科研工作者加速開發(fā)改良品種,為小麥基礎應用科學提供支持。
☆?小麥組學數據在線平臺WheatOmic:實現了對多套麥族物種基因組、轉錄組、變異組、突變體庫外顯子組、表觀修飾組等大數據的可視化,并具有擬南芥/水稻-小麥同源基因鑒定、基因共表達網絡構建、蛋白互作、轉錄因子結合位點分析等多個分析工具。
☆?小麥族同源基因數據庫TriticeaeGeneTribe:利用小麥族物種中已發(fā)表的基因組,對不同參考基因組間同源基因鑒定,構建了小麥族同源基因數據庫。同時,數據庫具有基因功能查詢,GO富集分析,同源基因查詢,基因組區(qū)間共線性分析等功能。
☆?小麥蛋白質組數據庫
☆?小麥及其祖先的基因組變異數據庫:適用于多套小麥及祖先種變異數據集的查詢,可對大規(guī)模樣本的VCF文件實現在線的快速檢索和分析可視化。
☆?小麥基因組變異與選擇信號數據庫WGVD:匯總了從968個面包小麥及其祖先中收集到的SNPs、indels,以及基于93個小麥全基因組重測數據的SNPs評估的小麥馴化和改良過程中的選擇特征。數據庫主要提供變異、基因組選擇信號搜索、基因組瀏覽和比對功能。
☆?小麥WheatCNVb數據庫:基于小麥CNVb新型分子標記系統(tǒng),支持查詢小麥種質資源的CNVb標記,可視化CNVb指紋,并進行基于CNVb指紋的品種比較。
☆?利用整合基因調控網絡探索小麥功能基因的交互式平臺wGRN:提供了基因調控查詢、功能基因預測和QTG挖掘等十余個功能模塊,建立了小麥整合基因調控網絡,實現了可持續(xù)整合大規(guī)模調控數據集的網絡化研究框架。
☆?異源六倍體小麥及其祖先的比較共表達網絡分析數據庫WheatCENet:集成了功能注釋,蛋白質-蛋白質相互作用、miRNAs,GO注釋、GSEA等工具能夠搜索和比較特定的功能共表達網絡,識別其中聚集的基因的相關功能。
☆?小麥種質資源血緣區(qū)間比較數據庫WheatCompDB:主要針對數據集中任意兩個樣本間的種質資源血緣區(qū)間比較分析,支持基因組水平、染色體水平和局部區(qū)間水平下種質資源網絡的構建和挖掘。
玉米數據庫
☆?玉米基因組和遺傳分析平臺:數據庫包含了玉米的基因組序列、基因注釋、遺傳圖譜、突變體信息、表達數據、相關的文獻和研究工具。旨在支持玉米遺傳學和基因組學的研究,為科研工作者提供訪問和分析玉米的遺傳和基因組數據的平臺。
☆?玉米及其野生近緣種的基因組工程資源庫:包括玉米及其野生親屬禾本科的復雜性狀,稀有遺傳變異如何影響整體植物功能。
☆?玉米多組學基因網絡分析平臺:整合了701個轉錄組學數據和108個表觀基因組數據,并研究了具有多維組學水平的不同條件網絡。MCENet?還提供?5?個網絡訪問分析工具包(即?Network Search、Network Remodel、Module Finder、Network Comparison?和?Dynamic Expression View)和多個網絡功能支持工具包。
☆?適應玉米多組學時代的綜合數據庫:整合了來自于同一玉米群體的基因組、轉錄組、表型組、代謝組、表觀基因組、遺傳變異以及遺傳定位結果等多組學數據,同時收錄了多個玉米基因組,可以進行比較基因組、共線性分析、表達聚類、遺傳變異基因分型、連鎖圖譜、定位結果、組蛋白修飾以及甲基化等多組學數據進行檢索和分析,實現在不同組學數據之間進行跳轉。
☆?擬南芥和玉米蛋白質組數據庫:為通過實驗鑒定擬南芥和玉米中的蛋白質提供了集成資源。內部BLAST比對鏈接玉米和擬南芥信息,實驗鑒定基于細胞類型特異性蛋白質組或特定亞細胞蛋白質組(例如葉綠體,類囊體,核苷)和總葉蛋白質組樣品的內部質譜(MS)。
☆?利用玉米單倍型標簽多態(tài)性分析工具:HTP數據庫(HTPdb):該數據庫覆蓋了育種中常用的3,587個重要玉米自交系,其中包括172,921個非冗余的HTP等位基因變異,提供了豐富的單倍型標簽資源。同時,基于HTP標記的特點,研究人員在HTPTools中集成了智能區(qū)塊數據填充算法,當僅需獲取少量HTP標記的基因型時,可以通過該功能快速地獲取對應區(qū)塊的完整數據。
☆?玉米網絡數據庫MaizeNetome:其中包含從基因組到轉錄組、翻譯組和蛋白質組的整個遺傳傳遞。多組學整合網絡圖譜通過ChIA-PET整合基因組相互作用,包括跨根、葉、穗、?SAM和其它31個組織或發(fā)育階段mRNA-seq、circRNA-seq?的轉錄組共表達網絡,跨?21?個不同組織/階段Ribo-seq?數據,?B73?材料8?個不同組織的酵母雜交蛋數據。數據庫可以幫助輔助QTL定位,并系統(tǒng)剖析農藝性狀的可能分子機制,為快速基因克隆和高效的網絡分析鋪平道路。
☆?全基因組范圍的玉米基因輔助功能網絡數據庫MaizeNet:是通過集成?21?個組件網絡構建的,其中每個網絡都是從不同的組學數據中推斷出來的。 通過整合異構數據,MaizeNet?提供了玉米遺傳結構的全面視圖,為特定生物過程確定候選基因的優(yōu)先級??梢岳?MaizeNet?中實現的優(yōu)先級服務來生成新的功能假設,縮小候選基因的范圍,并確定該功能的新基因。
☆?中國玉米品種系譜數據庫:收錄自交系及品種信息10000余條,涉及自交系1218個,雜交種7823個。該數據庫實現了品種信息檢索、系譜追溯、子代查詢、定制化查詢、用戶上傳及糾錯系譜信息等功能,便于中國玉米育種家及科研工作者快捷查詢玉米自交系及品種的信息及系譜關系。
大豆數據庫
☆?水稻、小麥和大豆的分子育種資源庫:這是一個集成數據庫,收集了群體測序、種質資源、表型和各種基因組數據。
☆?大豆基因組學和分子生物學數據庫:為大豆研究者提供了大量的數據和工具,以支持大豆的遺傳學、基因組學和育種研究。用戶可以通過SoyBase查找大豆的基因組信息、遺傳資源、表型數據等,并利用其中的分析工具進行數據挖掘和可視化。
☆?大豆種質資源組學數據庫:用戶可提供離散值的表型數據來幫助用戶識別用于育種或遺傳研究的“有用”種質資源,實現了2K-SG的33個數量性狀與9個質量性狀的共享;用戶可以利用SoyFGB或未公開表型數據來實現表型和單倍型變異的相關性在不同基因組分辨率下的在線解析;獲得基因組作圖定位與表型性狀相關區(qū)域,使用?“搜索”和“瀏覽”模塊,用戶可以獲取2K-SG?的基因組變異,用于實驗驗證。
☆?大豆多組學數據庫SoyMD:共提供了8個組學模塊以方便用戶瀏覽和分析多組學數據,包括基因組、轉錄組、表觀基因組、表型組、變異組、工具、下載和幫助模塊。
☆?大豆多組學數據庫SoyOmics:從基因組、變異組、轉錄組、表型組等不同層面整合了大豆相關數據集,實現了不同層次組學數據的交互查詢和聯合比較分析。數據庫目前收錄了多個大豆品系的基因組組裝,注釋數據,以高質量的ZH13作為參考基因組,對2898份材料的全基因組測序數據進行了全基因組序列變異檢測,鑒定到約3800萬條SNP/INDEL變異數據,提供了來自大豆泛基因組分析的約55萬條結構變異數據以及基于結構變異構建的圖泛基因組。收錄了多個品系不同組織時期的表達數據。數據庫針對115個表型多年多點測定的約2.7萬條表型記錄進行了本體注釋和歸類,并將表型數據與變異數據進行關聯。除以上組學數據外,數據庫同時提供了甲基化測序數據,Soy40K大豆芯片數據。
☆?Soybean Expression Atlas的升級版本其中包含?5481?個公開可用的?RNA-seq?樣本的轉錄本和基因級轉錄本豐度矩陣。
☆?iSoybean:收集了EMS誘變的大豆突變種群,并利用全基因組測序技術對1,044個突變系中的變異進行了詳細表征。該網站致力于提供關于大豆突變體的詳盡信息,并通過種子庫分發(fā)這些突變體,促進其在功能基因組學研究領域的快速應用。
☆?SoyDNGP:構建了一個基于預測模型SoyDNGP的大豆表型預測平臺,為基于基因變異的作物表型預測研究提供了創(chuàng)新的工具和方法。
百邁客生物深耕物種多組學數據庫建設,已為眾多科研機構與高校提供從數據存儲到分析挖掘的全流程解決方案,已成功應用,取得了顯著的研究成果。無論是物種保護、生態(tài)監(jiān)測還是遺傳育種,我們的數據庫都為其提供了強有力的數據支持,助力科研人員攻克一個又一個科學難題。
部分合作案例
百邁客生物致力于為您提供最準確、最全面的作物數據,將持續(xù)更新作物育種動態(tài)、種植技術及市場資訊,歡迎科研工作者提出數據需求與合作建議,共同推動農業(yè)科技創(chuàng)新。