
-
生物通官微
陪你抓住生命科技
跳動的脈搏
章元明教授團隊構(gòu)建破解環(huán)境適應(yīng)性的基因×環(huán)境互作檢測、表型可塑性研究和多性狀協(xié)同分子育種設(shè)計的高效快速大數(shù)據(jù)關(guān)聯(lián)分析計…
【字體: 大 中 小 】 時間:2026年02月26日 來源:華中農(nóng)業(yè)大學植物科學技術(shù)學院
編輯推薦:
南湖新聞網(wǎng)訊(通訊員 王靖天 韓雪蓮)近日,植物科學技術(shù)學院章元明教授團隊研究成果發(fā)表
南湖新聞網(wǎng)訊(通訊員 王靖天 韓雪蓮)近日,植物科學技術(shù)學院章元明教授團隊研究成果發(fā)表。研究提出了大數(shù)據(jù)關(guān)聯(lián)分析Fast3VmrMLM新算法,以實現(xiàn)基因×環(huán)境互作(GEI)檢測、作物表型可塑性研究和分子育種設(shè)計。挖掘的480個已知基因或GEI驗證其有效性,揭示玉米開花期可塑性分子機制,鑒定15個早花與高產(chǎn)育種潛力高的種質(zhì)和29個基因。
一個半世紀前,孟德爾通過豌豆雜交試驗揭示了遺傳學兩大基本規(guī)律,為作物雜交育種奠定了理論基礎(chǔ)。進入基因組時代,以全基因組關(guān)聯(lián)分析(genome-wide association study,GWAS)為代表的統(tǒng)計遺傳方法為科學家精準定位了一批控制重要農(nóng)藝性狀的關(guān)鍵基因,育種學家利用這些基因“按圖索驥”,育成了大量高產(chǎn)、優(yōu)質(zhì)、高抗和強環(huán)境適應(yīng)性的優(yōu)良品種,為保障人類糧食安全作出重要貢獻。然而,當今的極端氣候變化日益頻繁,同一基因在不同環(huán)境的表現(xiàn)差異顯著,“橘生淮北則為枳”的現(xiàn)象日益成為制約現(xiàn)代育種的重要瓶頸。因此,深入解析生命與自然之間復雜而精細的對話,基因×環(huán)境互作(gene-by-environment interaction, GEI),已成為作物遺傳改良領(lǐng)域亟待突破的關(guān)鍵科學問題。
章元明教授團隊在Briefings in Bioinformatics和Plant Communications分別發(fā)表大群體二歧和數(shù)量性狀的QTN快速檢測算法后,又在基因×環(huán)境互作檢測的GWAS方法學研究中取得重要進展,相關(guān)成果以“A fast method for breeding by design via G×E interactions detected in large-scale climatic, phenomic and genomic data”為題,在國際期刊National Science Review(《國家科學評論》)上在線發(fā)表。
針對大群體多環(huán)境數(shù)據(jù)的GEI高效檢測工具匱乏、對品種資源和育種群體GEI檢測關(guān)注不足等科學問題,本研究巧妙地融合全基因組掃描策略與機器學習算法,提出了一種能夠同時整合氣象因素、基因組標記和性狀表型大數(shù)據(jù)GWAS的Fast3VmrMLM新算法。在此基礎(chǔ)上,進一步將SNP標記推廣至bin/基因單倍型和結(jié)構(gòu)變異等分子生物學標記,將性狀表型推廣至基因表達量和代謝物等多組學性狀,構(gòu)建了一個面向復雜數(shù)據(jù)類型的統(tǒng)一框架,并研制軟件包。這為多年多點試驗數(shù)據(jù)的聯(lián)合關(guān)聯(lián)分析、環(huán)境可塑性機制解析和氣候變化背景下區(qū)域適應(yīng)性品種精準育種設(shè)計提供了高效、快速且計算資源消耗低的技術(shù)平臺。
為系統(tǒng)挖掘GEIs和解析環(huán)境可塑性基因的分子機制,提出了兩種互補的分析模塊:1)利用品種資源和育種大群體性狀表型與標記基因型的多環(huán)境QEI檢測模塊,直接鑒定數(shù)量性狀核甘酸(QTNs)和QTN×環(huán)境互作(QEIs);2)利用性狀表型對氣象因素(處理水平)的回歸參數(shù)作為表型可塑性指標,通過QTN檢測模塊,間接檢測QTN×氣象因素互作(QMIs)。
在統(tǒng)計建模層面,研究團隊構(gòu)建了包含環(huán)境效應(yīng)、基因加性(a)和顯性(d)效應(yīng)、GEI的加性×環(huán)境(ae)和顯性×環(huán)境(de)的互作效應(yīng)及其a、d、ae和de多基因背景的壓縮方差組分混合線性全模型。在分析框架方面,新方法延續(xù)并拓展了此前提出的“全基因組掃描+機器學習”框架,借助機器學習在縮減的多位點模型中檢測QTNs和QEIs的優(yōu)勢,有效突破了傳統(tǒng)GWAS在識別顯性、小效應(yīng)及稀有變異方面的“視野盲區(qū)”。在模擬數(shù)據(jù)集II中,F(xiàn)ast3VmrMLM的QTN和QEI檢測平均功效高達87.75%,假陽性率僅為0.3?,顯著優(yōu)于傳統(tǒng)方法的2.40%–72.75%的平均功效和0.16?–54.68?的假陽性率(圖1)。在1,439水稻、18K水稻和G2F玉米數(shù)據(jù)重新分析中,新方法分別挖掘42、37和10個經(jīng)分子生物學實驗證實的已知GEIs(圖2和圖3),充分驗證了其有效性。

圖1 Fast3VmrMLM和現(xiàn)有算法的Monte Carlo模擬研究

圖2 18K水稻真實數(shù)據(jù)挖掘的已知基因和已知基因×環(huán)境互作
針對多年多點作物大群體數(shù)量性狀表型、氣象大數(shù)據(jù)和海量基因組信息帶來的計算挑戰(zhàn),F(xiàn)ast3VmrMLM系統(tǒng)整合了八項先進的統(tǒng)計與計算技術(shù),實現(xiàn)了高效、快速、大樣本和低計算資源消耗的關(guān)聯(lián)分析Fast3VmrMLM方法。新方法分析1,439水稻數(shù)據(jù)集的運行時間較原3VmrMLM方法縮短近50倍;在60線程和1TB內(nèi)存的小型服務(wù)器上,成功完成了3VmrMLM、FarmCPU和EMMAX等現(xiàn)有方法無法實現(xiàn)的18K水稻和玉米G2F數(shù)據(jù)集分析。在Monte Carlo模擬研究中,新方法聯(lián)合分析20,000個品種100萬個標記和兩個環(huán)境表型數(shù)據(jù)集僅需19.33分鐘,內(nèi)存占用13.51GB;1,000個品種100萬個標記和40個環(huán)境表型數(shù)據(jù)集,耗時777.48分鐘,內(nèi)存占用4.88GB;20,000個品種100萬標記和20個環(huán)境表型數(shù)據(jù)集,耗時48.01小時,占用22.70GB內(nèi)存,使大數(shù)據(jù)遺傳分析在小型計算設(shè)備上運行成為可能,突破了大數(shù)據(jù)的“算力壁壘”,為小團隊分析大數(shù)據(jù)提供方法學平臺。
為突破GWAS僅關(guān)注SNP標記的“思維定式”,研究團隊進一步拓展了Fast3VmrMLM-Hap方法以檢測與性狀顯著關(guān)聯(lián)的bin/基因單倍型及其環(huán)境互作,顯著提高了稀有位點的檢測功效(圖1d),在真實數(shù)據(jù)中挖掘到更多的已知基因和GEIs(圖2)。同時,團隊還提出Fast3VmrMLM-mQTL方法,以適應(yīng)結(jié)構(gòu)變異、調(diào)控元件、增強子和lncRNA類型等分子生物學需求,并通過大豆結(jié)構(gòu)變異數(shù)據(jù)成功挖掘了一個包含光照響應(yīng)結(jié)構(gòu)域、調(diào)控籽粒重量的已知GEI。
作物在不同環(huán)境中表現(xiàn)出顯著的表型可塑性,其本質(zhì)是基因?qū)Νh(huán)境和氣象因素的響應(yīng)。圍繞玉米開花期這一重要性狀(圖3A),本研究整合了來自12個環(huán)境的1,140份玉米自交系開花表型、437,214個SNP標記基因型和相應(yīng)時空的氣象數(shù)據(jù),利用Fast3VmrMLM和Fast3VmrMLM-Hap方法,從多環(huán)境性狀表型“直接”、性狀對氣象因素的回歸參數(shù)“間接”兩個層面系統(tǒng)挖掘GEIs(圖3B),揭示不同地區(qū)玉米開花早晚差異的遺傳×環(huán)境互作的遺傳基礎(chǔ)。
在德國哥廷根,由于生育早期有效積溫顯著偏低,低溫環(huán)境增強了ZmRR2的表達量,并可能與ZmEhd1形成抑制復合體,從而抑制類成花素基因ZCN4和ZCN11的表達,延緩營養(yǎng)生長向生殖生長的轉(zhuǎn)變,最終導致開花推遲(圖3C)。該結(jié)果揭示了“低溫—調(diào)控因子—成花”通路協(xié)同作用對區(qū)域性晚花現(xiàn)象的驅(qū)動機制。
在美國印第安納州,更長的日照時長、更高的光合有效輻射和更充沛的降水量,分別促進ZmNF-YA3、ZmID1和ZMM4基因的表達,協(xié)同加速玉米開花進程(圖3D)。而在美國德克薩斯州和佐治亞州的低緯度地區(qū),盡管光周期較印第安納州更短,但是玉米開花期并未表現(xiàn)出更早的趨勢。這可能與播種期差異密切相關(guān)。低緯度兩地區(qū)于3月播種,顯著早于印第安納州的5月播種,導致生育早期的有效積溫不足,從而成為開花延遲的關(guān)鍵因素(圖3C)。上述結(jié)果進一步凸顯了“有效積溫閾值”在玉米物候可塑性形成中的核心作用。這為解析作物氣候適應(yīng)性和表型可塑性的遺傳基礎(chǔ)提供了參考范式。

圖3 G2F玉米開花期數(shù)據(jù)集的表型可塑性解析
在氣候變化背景下,如何高效利用GEIs和可塑性基因成為區(qū)域適應(yīng)性大品種培育的關(guān)鍵。本研究基于Fast3VmrMLM新方法和單倍型分析,在玉米大規(guī)模G2F數(shù)據(jù)集中鑒定的13個已知基因、8個已知GEIs和7個環(huán)境可塑性基因可提早開花1.10至6.61天;9個已知基因、1個已知GEI和3個環(huán)境可塑性基因可提高產(chǎn)量0.51至3.56 Mg?ha?1(圖4)。在此基礎(chǔ)上,進一步篩選出一批兼具“早花與高產(chǎn)”優(yōu)勢的優(yōu)異雜交組合,可作為區(qū)域適應(yīng)性育種的優(yōu)異種質(zhì)資源。在全環(huán)境綜合表現(xiàn)中,共有12個優(yōu)異雜交組合同時進入“早花與高產(chǎn)”前10%行列,例如W10004_0241/PHP02與W10004_0395/PHP02分別攜帶45.45%與36.36%、40.00%與30.00%的“早花與高產(chǎn)”優(yōu)勢單倍型,顯示出優(yōu)異的分子設(shè)計育種潛力。在印第安納州特定環(huán)境下,篩選出同時位列“早花與高產(chǎn)”前10%的雜交組合W10004_0032/PHK76、W10004_0956/PHK76 和 W10004_0991/PHK76,其早花優(yōu)勢單倍型比例達到45.45%–59.01%,高產(chǎn)優(yōu)勢單倍型比例為28.57%。因此,憑借Fast3VmrMLM高效分析大規(guī)模數(shù)據(jù)和精準檢測環(huán)境互作基因,有望成為區(qū)域適應(yīng)性和氣候適應(yīng)性的作物育種設(shè)計提供重要技術(shù)支撐。

圖4 早花和高產(chǎn)玉米種質(zhì)前10%的已知基因和GEIs的優(yōu)異單倍型分布
為整合此前的研究成果,本研究將所提出的新方法集成為多環(huán)境GWAS模塊,并與此前發(fā)布的單環(huán)境GWAS模塊(Wang et al., 2025)相結(jié)合,研制了Fast3VmrMLM v2.0新版本軟件并在GitHub上免費釋放。
我校植物科學技術(shù)學院博士后王靖天、博士研究生韓雪蓮為論文共同第一作者,章元明教授為論文通訊作者。植物科學技術(shù)學院已畢業(yè)博士章含青,博士研究生趙苗苗、陳瑩,碩士研究生江秋云參與了本研究。該研究得到了國家自然科學基金項目的資助。
論文鏈接:
https://doi.org/10.1093/nsr/nwag095
https://www.cell.com/plant-communications/fulltext/S2590-3462(25)00147-6
https://academic.oup.com/bib/article/25/4/bbae290/7695424?searchresult=1
https://github.com/YuanmingZhang65/Fast3VmrMLM
審核人:章元明