《Genome》:Unraveling the environmental regulation of soybean seed protein through WGCNA and multiWGCNA
編輯推薦:
大豆籽粒蛋白含量在加拿大東西部產(chǎn)區(qū)存在顯著差異(西低東高1%-5%),其環(huán)境調(diào)控機制尚不明晰。為解決此問題,研究人員通過多加權(quán)基因共表達網(wǎng)絡(luò)分析(multiWGCNA),解析了不同環(huán)境和蛋白質(zhì)含量下的大豆葉片轉(zhuǎn)錄組。研究揭示了由環(huán)境和蛋白質(zhì)含量共同調(diào)控的關(guān)鍵共表達模塊,這些模塊涉及表觀遺傳調(diào)控、翻譯調(diào)控、光合作用、碳氮代謝及種子蛋白儲存液泡填充等生物學過程。這項工作闡明了影響大豆籽粒組成的復(fù)雜環(huán)境調(diào)控網(wǎng)絡(luò),為定向改良大豆品質(zhì)以適應(yīng)不同產(chǎn)區(qū)提供了重要分子線索。
大豆,作為全球最重要的油料和蛋白作物之一,其種子富含的蛋白質(zhì)是人類和動物營養(yǎng)的重要來源。然而,一個有趣的現(xiàn)象長期困擾著加拿大的大豆種植者和科學家:在加拿大西部產(chǎn)區(qū)(如曼尼托巴省和薩斯喀徹溫省)種植的大豆,其籽粒蛋白質(zhì)含量往往比東部產(chǎn)區(qū)(如安大略省和魁北克省)種植的大豆低大約1%到5%。這種差異持續(xù)了二十多年,但其背后的分子機制卻如同籠罩在迷霧之中。是更短的生長季、更少的降水、還是更低的溫度在起作用?環(huán)境因素是如何“指揮”大豆體內(nèi)的基因,最終影響種子中蛋白質(zhì)的積累的?回答這些問題,對于培育適應(yīng)加拿大不同氣候區(qū)的高產(chǎn)優(yōu)質(zhì)大豆品種,保障國家糧食安全和農(nóng)業(yè)競爭力具有至關(guān)重要的意義。
為了撥開這層迷霧,一支由加拿大農(nóng)業(yè)及農(nóng)業(yè)食品部(AAFC)渥太華研發(fā)中心領(lǐng)導(dǎo)的研究團隊展開了一項雄心勃勃的研究。他們選取了10個具有不同種子蛋白含量背景的早熟大豆品系,在2018年至2021年間,分別種植于一個東部地點(安大略省渥太華)和三個西部地點(曼尼托巴省布蘭登、莫登及薩斯喀徹溫省薩斯卡通),構(gòu)建了一個覆蓋多年份、多地點、多基因型的復(fù)雜研究體系。通過測量種子蛋白含量,并采集大豆鼓粒初期(R5期)的葉片進行RNA測序,研究團隊獲得了海量的表型和轉(zhuǎn)錄組數(shù)據(jù)。面對如此錯綜復(fù)雜的數(shù)據(jù),傳統(tǒng)的差異表達分析可能難以捕捉基因間協(xié)同工作的整體網(wǎng)絡(luò)。因此,研究人員祭出了生物信息學分析的“利器”——加權(quán)基因共表達網(wǎng)絡(luò)分析(WGCNA)及其拓展方法多WGCNA(multiWGCNA)。這些方法能夠從全轉(zhuǎn)錄組中識別出共同表達、功能相關(guān)的基因模塊,并能將這些模塊與特定的樣本性狀(如產(chǎn)區(qū)“東/西”和蛋白含量“低/中/高”)進行關(guān)聯(lián),從而找出那些與“產(chǎn)區(qū)×蛋白含量”這一復(fù)合性狀顯著相關(guān)的關(guān)鍵基因共表達網(wǎng)絡(luò)。
這項系統(tǒng)性的研究最終成功發(fā)表在了國際知名期刊《Genome》上。為了深入探索大豆籽粒蛋白環(huán)境調(diào)控的奧秘,研究人員主要運用了以下幾項關(guān)鍵技術(shù)方法:首先,他們在加拿大東西部四個地點進行了為期四年(2018-2021)的田間試驗,構(gòu)建了包含10個不同蛋白含量大豆品系的多地點多年份樣本隊列。其次,他們利用近紅外分析儀(Infratec 1241 Grain Analyzer)精確測定了種子蛋白含量。然后,研究團隊對R5期葉片樣本進行了RNA提取和高通量RNA測序(Illumina平臺),并利用Wm82.a2.v1參考基因組進行比對和定量。最后,也是最為核心的分析,是應(yīng)用加權(quán)基因共表達網(wǎng)絡(luò)分析(WGCNA)和多WGCNA(multiWGCNA)對標準化后的轉(zhuǎn)錄組數(shù)據(jù)進行分析,以識別與“產(chǎn)區(qū)”和“蛋白含量”性狀顯著相關(guān)的差異共表達基因模塊,并對這些模塊進行基因本體(GO)富集分析和京都基因與基因組百科全書(KEGG)通路映射,以闡釋其潛在的生物學功能。
研究結(jié)果
環(huán)境測量與種子蛋白測量
環(huán)境數(shù)據(jù)證實了東西部產(chǎn)區(qū)的氣候差異:西部生長季平均溫度比東部低2.8–6.4°C,平均相對濕度低1.3%–9.2%,總降水量也少于東部。種子蛋白測量結(jié)果與長期觀察一致:在大多數(shù)年份和品系中,西部種植的大豆籽粒蛋白含量顯著低于東部。直觀展示了各品系在不同地點和年份的平均蛋白含量,西部(藍色)普遍低于東部(黃色)。
PCA、尺度自由拓撲和平均連通性
對轉(zhuǎn)錄組數(shù)據(jù)的主成分分析(PCA)顯示,東部和西部樣本的基因表達譜存在明顯分離,表明環(huán)境對大豆整體轉(zhuǎn)錄狀態(tài)有深遠影響。通過尺度自由拓撲分析篩選,2019年和2021年的數(shù)據(jù)集符合網(wǎng)絡(luò)構(gòu)建標準,被用于后續(xù)的WGCNA/multiWGCNA分析。
模塊識別與差異模塊表達
通過multiWGCNA分析,研究人員從2019年和2021年的網(wǎng)絡(luò)中分別識別出44個和63個共表達基因模塊。經(jīng)過嚴格篩選,他們重點關(guān)注了兩個與“蛋白×產(chǎn)區(qū)”性狀顯著相關(guān)的模塊:2019-淺青色(lightcyan)模塊和2021-淺黃色(lightyellow)模塊。這兩個模塊的基因在不同產(chǎn)區(qū)及不同蛋白含量樣本中的共表達模式存在顯著差異。
2019年與蛋白×產(chǎn)區(qū)相關(guān)的模塊
2019-淺青色模塊包含74個基因,其表達在西部產(chǎn)區(qū)的中、低蛋白樣本中上調(diào),而在東部產(chǎn)區(qū)的同類樣本中下調(diào)。展示了該模塊的差異共表達熱圖、樣本特征基因表達條形圖及按性狀分組表達箱線圖。該模塊的樞紐基因(hub gene)編碼一個網(wǎng)狀蛋白(reticulon),其他高連通性基因涉及蔗糖合酶、NADH–細胞色素b5還原酶和HVA22樣蛋白等。功能分析表明,該模塊富含應(yīng)激反應(yīng)(如抗壞血酸過氧化物酶、熱激蛋白)、碳代謝(蔗糖合酶、蘋果酸脫氫酶)、氮同化(天冬酰胺-tRNA連接酶)以及病原體反應(yīng)(類奇甜蛋白、葡聚糖酶)相關(guān)基因。展示了該模塊內(nèi)基因的共表達關(guān)系網(wǎng)絡(luò)。
2021年與蛋白×產(chǎn)區(qū)相關(guān)的模塊
2021-淺黃色模塊包含70個基因,其表達在東部產(chǎn)區(qū)(尤其是高蛋白樣本)中上調(diào),在西部產(chǎn)區(qū)則普遍下調(diào)。展示了該模塊的分析結(jié)果。該模塊的樞紐基因編碼核糖體小亞基蛋白S12,模塊內(nèi)富含核糖體亞基基因(19個)、光合系統(tǒng)蛋白基因、染色質(zhì)調(diào)節(jié)蛋白(如DEK結(jié)構(gòu)域蛋白)以及組蛋白去甲基酶基因等。展示了其共表達網(wǎng)絡(luò)。功能富集分析顯示,該模塊與染色質(zhì)重塑、組蛋白結(jié)合、翻譯以及光合作用等過程密切相關(guān)。
研究結(jié)論與討論
綜合以上結(jié)果,本研究通過WGCNA/multiWGCNA這一強大的生物信息學工具,成功解析了環(huán)境調(diào)控大豆籽粒蛋白質(zhì)積累的復(fù)雜分子網(wǎng)絡(luò)。研究發(fā)現(xiàn)的兩個關(guān)鍵模塊揭示了截然不同但又相輔相成的調(diào)控機制。
2019-淺青色模塊指向了一種應(yīng)激響應(yīng)驅(qū)動的代謝重編程機制。西部產(chǎn)區(qū)相對嚴苛的環(huán)境(低溫、少雨)可能激發(fā)了更強的生物與非生物脅迫響應(yīng)。模塊中HVA22樣蛋白的上調(diào)可能通過抑制囊泡運輸來延遲蛋白質(zhì)儲存液泡的充實,而應(yīng)激相關(guān)的碳氮代謝基因(如蔗糖合酶、天冬酰胺-tRNA連接酶)的差異共表達,則暗示資源可能被重新分配以應(yīng)對脅迫,而非全力進行種子蛋白質(zhì)合成,這直接導(dǎo)致了西部大豆籽粒蛋白含量的降低。
2021-淺黃色模塊則揭示了表觀遺傳與翻譯水平上的精密調(diào)控。該模塊在東部產(chǎn)區(qū)高蛋白樣本中的高表達,關(guān)聯(lián)到染色質(zhì)重塑活性(如DEK蛋白、組蛋白修飾酶)和核糖體生物合成的上調(diào)。這表明東部適宜的環(huán)境可能通過表觀遺傳修飾“打開”有利于蛋白質(zhì)合成和光合作用的基因網(wǎng)絡(luò),并通過增加翻譯機器(核糖體)的豐度來高效生產(chǎn)蛋白質(zhì),從而支持更高的籽粒蛋白積累。此外,模塊中光合作用相關(guān)基因的共表達也提示,東部環(huán)境下可能具有更強的光合能力,為蛋白質(zhì)合成提供了更充足的碳骨架和能量。
重要意義 本研究的突破性在于,它超越了尋找單個差異表達基因的傳統(tǒng)思路,從基因網(wǎng)絡(luò)協(xié)同工作的視角,系統(tǒng)性地揭示了環(huán)境通過調(diào)控多個互相關(guān)聯(lián)的生物學過程(脅迫響應(yīng)、碳氮代謝、表觀遺傳、翻譯效率等)來影響大豆籽粒蛋白質(zhì)含量的整合機制。這不僅為理解“西低東高”這一長期農(nóng)學現(xiàn)象提供了堅實的分子生物學解釋,更為大豆育種家提供了寶貴的靶點信息。未來,通過分子標記輔助選擇或基因編輯技術(shù),針對這些關(guān)鍵模塊中的樞紐基因(如網(wǎng)狀蛋白、HVA22樣蛋白、核糖體蛋白、DEK蛋白等)進行調(diào)控,有望培育出在不同環(huán)境條件下都能穩(wěn)定保持高蛋白含量的大豆新品種,從而提升加拿大乃至全球大豆生產(chǎn)的品質(zhì)與韌性。這項研究也展示了multiWGCNA在解析復(fù)雜農(nóng)藝性狀與環(huán)境互作方面的強大能力,為其他作物的類似研究提供了典范。