SSR又稱為微衛(wèi)星序列,是一種由幾個核酸為重復單位的DNA序列,廣泛分布于動植物DNA中,在種內和種間群的遺傳中具有多樣性,因此廣泛應用于DNA的barcoding、SSR分子標記開發(fā)、分子育種、物種資源與個體鑒定。隨著越來越多的基因組序列和轉錄組序列的產生,海量DNA序列的應用與開發(fā)成了一個關鍵的瓶頸。
中國科學院昆明植物研究所博士王學文與國家公安部物證中心共同自主研發(fā)了一款新的DNA序列中SSR分析和應用的軟件,名字為GMATA(Genome-wide Microsatellite Analyzing Tool Package)。該軟件具有五大功能:(1)SSR序列發(fā)掘,(2)統(tǒng)計分析,(3)統(tǒng)計圖形,(4)分子標記設計與多態(tài)性分析,(5)SSR及分析標記在基因組中整合及圖形化顯示。GMATA采用了全新的策略與算法,主要解決了大基因組數據中SSR分析與應用困難的問題,提供了一站式的DNA序列中SSR分析和SSR分子標記應用設計的解決方案。
與已有的同類軟件相比,GMATA是目前運行速度最快、功能最多的軟件;首次提供5個層次的SSR統(tǒng)計分析與高分辨率的統(tǒng)計圖形的生成;在Windows,或者Mac OS,或者Linux平臺運行,一臺普通電腦就可以分析任何大小的DNA序列中SSR;具有多種友好可選運行界面,用戶只需要點擊鼠標或者輸入命令;首次將SSR、SSR分子標記與全基因組序列、基因功能等數據圖形化整合顯示。GMATA是基因組大數據中SSR分析與分子標記開發(fā)的理想工具。
研究人員使用該軟件,對主要禾本科糧食作物例如小麥與水稻等15個全基因組序列和轉錄組序列進行分析,首次發(fā)現了禾本科中SSR分布的新規(guī)律。結果表明,以前對禾本科植物中的SSR的理解只適合小部分基因組;而絕大部分禾本科中的真正的規(guī)律為:最主要的SSR motif為二核苷酸單元的GA/TC,接著是A/T單元,然后再是GCG/CGC單元。禾本科含有豐富的G/C,但是最豐富的SSR卻不是G/C。這些信息對分子標記的開發(fā)和應用選擇具有重要指導意義。此外,該研究還對五大類煙草的大基因組中的SSR分子標記進行開發(fā),驗證了該軟件的應用前景。
該研究成果以GMATA: an integrated software package for genome-scale SSR mining, marker development and viewing 為題,近日發(fā)表在《植物科學前沿》(Frontiers in Plant Science)期刊上。
軟件使用界面
軟件圖形輸出節(jié)選