《Plant Direct》:Genome-Wide Analysis of the lncRNAs and miRNAs Involved in Flower Development in Radish
編輯推薦:
編者推薦:
本研究利用RNA-seq和small RNA測序技術,全面解析了蘿卜(Raphanus sativusL.)營養生長與開花階段的長鏈非編碼RNA(lncRNA)和微小RNA(miRNA)表達譜。研究共鑒定出5315個差異表達基因(DEG)、263個差異表達lncRNA(DElncRNA)和38個差異表達miRNA(DEmiRNA),并通過構建mRNA-lncRNA-miRNA調控網絡,揭示了miR156a-5p/RsSPL等關鍵模塊在調控蘿卜抽薹開花中的重要作用。該成果為深入闡明非編碼RNA在蔬菜作物生殖發育中的分子機制奠定了理論基礎。
文章內容總結
1 引言
蘿卜(Raphanus sativusL.)是十字花科重要的根菜類蔬菜,其產量和品質受抽薹和開花的早晚影響巨大。雖然關于miRNA調控蘿卜開花的研究已有一定基礎,但對長鏈非編碼RNA(lncRNA)在蘿卜開花發育中的鑒定與功能研究仍處于空白。lncRNA通常指長度超過200個核苷酸、不具備蛋白質編碼潛力的RNA分子,它們通過順式(cis)或反式(trans)作用調控基因表達,在植物的開花時間調控、果實發育及非生物脅迫響應等過程中扮演著重要角色。例如,在擬南芥中,來源于開花位點C(FLC)基因座的lncRNA COOLAIR和COLDAIR參與了春化過程中的表觀遺傳沉默。與此同時,植物miRNA作為關鍵的轉錄后調控因子,通過切割或抑制靶基因的翻譯,在調控植物從幼年向成年轉變、誘導成花能力以及花器官發育等過程中發揮核心作用,如miR156/SPL、miR172/AP2等模塊的作用已被廣泛證實。因此,系統鑒定和分析蘿卜開花過程中lncRNA和miRNA的表達譜,并解析其與mRNA之間的調控網絡,對于理解蘿卜抽薹開花的分子機制、培育耐抽薹品種具有重要的理論價值。本研究以晚抽薹蘿卜品系“XHT”為材料,利用RNA測序(RNA-seq)和小RNA測序技術,全面鑒定了其在營養生長和開花階段的mRNA、lncRNA和miRNA,旨在構建潛在的mRNA-lncRNA-miRNA調控網絡,為闡明蘿卜抽薹開花的分子調控機制提供新的見解。
2 材料與方法
研究選用蘿卜高代自交系“XHT”(晚開花,185天)的營養生長和開花階段樣品。幼苗在人工氣候室(晝/夜溫度25°C/16°C,光照16/8小時,濕度75%)中培養。采用TRIzol試劑提取總RNA,分別構建鏈特異性RNA測序文庫和小RNA測序文庫進行高通量測序。
對于lncRNA分析,使用HISAT2將高質量測序數據比對到蘿卜參考基因組。通過Cuffmerge合并各樣本的轉錄本,并采用一系列嚴格過濾步驟鑒定高可信度的lncRNA,包括過濾長度小于200 bp、表達量低(FPKM ≤ 0.5)的轉錄本,以及使用CNCI(Coding-Noncoding Index)、CPC(Coding Potential Calculator)、PfamScan和PhyloCSF軟件評估其編碼潛力。最終將無編碼潛力的轉錄本定義為候選lncRNA。差異表達分析使用edgeR軟件包,以q值 < 0.05且倍數變化 ≥ 1為閾值。
對于miRNA分析,使用Bowtie將小RNA測序獲得的干凈讀段比對到參考基因組,通過與miRBase數據庫比對鑒定已知miRNA,并利用miREvo和miRDeep2預測新的miRNA。miRNA的表達水平以TPM(transcript per million)進行標準化,差異表達分析使用DESeq R包,以倍數變化 > 1.5且p值 < 0.05為顯著性閾值。使用psRNATarget軟件預測miRNA的靶基因。
通過分析lncRNA上下游100 kb范圍內的蛋白編碼基因來預測其潛在的順式調控靶基因。通過計算lncRNA與編碼基因之間的皮爾遜相關系數(PCC)來鑒定反式調控關系。利用GOseq R包和KOBAS軟件分別對差異表達基因、lncRNA靶基因和miRNA靶基因進行GO(Gene Ontology)功能富集和KEGG(Kyoto Encyclopedia of Genes and Genomes)通路富集分析。
為了驗證關鍵調控模塊的功能,研究進行了蘿卜子葉的瞬時轉化實驗。將構建好的miR156a-5p過表達載體(帶有RUBY標簽)通過農桿菌(Agrobacterium tumefaciens)介導的注射法導入蘿卜子葉,觀察表型并檢測相關基因的表達變化。同時,采用雙熒光素酶報告基因系統驗證miR156對RsSPL10和RsSPL15的直接靶向關系。此外,利用qRT-PCR技術對篩選出的四個差異表達基因(RsSOC1、RsIQM-1、RsFT、RsRLF3)、三個差異表達lncRNA(RsLINC84、RsLINC502、RsLINC299)和三個差異表達miRNA(RsmiR399b、RsmiR169b-3p、RsmiR156a-5p)在六個春化時間點(5、10、15、20、25、30天)及開花階段的表達水平進行了驗證,使用2?ΔΔCt方法計算相對表達量,以蘿卜Actin基因作為內參。
3 結果
3.1 蘿卜中lncRNA的鑒定與特征分析
通過對蘿卜營養生長(XHT_VG)和開花(XHT_F)階段進行全轉錄組鏈特異性RNA測序,共鑒定出8828個lncRNA,其中7299個為已知lncRNA,1529個為新預測的lncRNA。與已知mRNA和已知lncRNA相比,新預測的lncRNA具有更少的外顯子數目、更短的序列長度和更短的開放閱讀框(ORF)。差異表達分析顯示,在兩個階段中共有263個lncRNA差異表達,其中165個上調,98個下調。層次聚類分析表明,這些差異表達的lncRNA在蘿卜營養生長和開花階段表現出組織特異性。
3.2 差異表達基因的鑒定與功能富集分析
共鑒定出5315個差異表達基因(DEG),其中3193個上調,2122個下調。GO富集分析發現,這些DEG顯著富集于52個GO條目,主要包括光合作用、碳水化合物代謝過程(生物過程)、膜蛋白復合物和類囊體(細胞組分)以及轉移酶活性和鈣離子結合(分子功能)等。KEGG通路富集分析顯示,DEG顯著富集于14條通路,包括碳代謝、輔因子生物合成、光合作用、光合生物中的碳固定以及類胡蘿卜素生物合成等。為了解所有DEG的表達模式,研究通過K-means聚類分析將其分為六個具有不同表達模式的簇,其中許多與開花時間調控相關的基因被識別,例如簇1中的RsAGL18、RsFT、RsELF3;簇2中的RsSPL15、RsSOC1、RsSWEET11和RsSWEET12;簇3中的RsFLC類基因、RsSPL4、RsPIF4、RsAGL18、RsELF4和RsFLC5;簇4中的RsCOL1;以及簇6中的RsFLC類基因、RsAGL18、RsEMF2、RsCPK6和RsVIN3等。這些基因的富集表明它們可能參與蘿卜開花的復雜調控網絡。
3.3 sRNA測序數據概覽與miRNA鑒定
通過對兩個階段的小RNA文庫進行測序,共檢測到134個miRNA,包括74個已知miRNA和60個新miRNA。差異表達分析鑒定出38個差異表達miRNA(DEmiRNA),其中21個已知,17個新預測,包括17個上調和21個下調。已知和新miRNA的長度范圍分別為20-23 bp和20-24 bp。
3.4 lncRNA順式與反式調控靶蛋白編碼基因的預測
通過分析lncRNA與mRNA在基因組100 kb窗口內的位置關系,共發現84個差異表達lncRNA對74個差異表達mRNA具有潛在的順式調控效應,涉及263個基因對。同時,通過表達相關性分析,發現107個差異表達lncRNA對96個差異表達mRNA存在潛在的反式調控效應,涉及25,520個基因對,其中81.83%為正相關,18.17%為負相關。
3.5 靶基因鑒定與分析
利用psRNATarget程序預測了miRNA的潛在靶基因。結果顯示,85個差異表達基因被預測為31個差異表達miRNA的靶標,形成89個miRNA-靶標模塊。相關性分析表明,其中26個DEmiRNA與45個DEG在47個模塊中呈負相關。對DEmiRNA靶標的GO注釋顯示,它們主要與核酸結合、DNA結合和離子結合(分子功能),生物合成過程、細胞過程調控、生物過程調控(生物過程),以及膜、細胞器和細胞組分(細胞組分)相關。KEGG通路富集分析顯示,靶基因主要參與次級代謝產物的生物合成、嘌呤代謝和代謝通路。此外,還預測了87個差異表達lncRNA是32個差異表達miRNA的潛在靶標,形成134個miRNA-靶標模塊。相關性分析表明,26個DEmiRNA與51個DElncRNA在67個模塊中呈負相關。
3.6 開花調控相關的mRNA-LncRNA-miRNA調控網絡
研究聚焦于與開花通路相關的、且與miRNA呈負相關的靶基因,結合miRNA靶向的lncRNA共表達對,構建了mRNA-lncRNA-miRNA調控網絡。具體構建了五個關鍵的調控網絡對:(1)miR156a-5p與三個差異表達基因(包括RsSPL10和RsSPL15)以及12個差異表達lncRNA的網絡;(2)miR399b與其靶基因RsFD的網絡;(3)novel-23與其靶基因RsSOC1以及三個差異表達lncRNA的網絡;(4)miR164c-5p與三個差異表達基因以及10個差異表達lncRNA的網絡;(5)miR165a-5p與一個差異表達基因以及七個差異表達lncRNA的網絡。這些網絡為理解非編碼RNA在開花調控中的協同作用提供了框架。
3.7 mRNAs、lncRNAs和miRNAs基因表達的驗證
通過qRT-PCR驗證了四個基因、三個lncRNA和三個miRNA的表達水平。結果顯示,RsSOC1、RsIQM-1、RsFT和RsRLF3在開花階段顯著上調,其中RsIQM-1和RsRLF3在六個春化時間點也顯著上調。三個lncRNA(RsLINC84、RsLINC502、RsLINC299)在春化過程和開花階段均顯著上調。RsmiR399b的表達在春化20天后開始增加,25天時達到峰值,并在開花階段保持較高水平。而RsmiR169b-3p和RsmiR156a-5p在整個春化過程中總體保持高表達,但在開花后下調。這些結果與RNA-seq和小RNA測序的結果一致,驗證了測序數據的可靠性。
3.8 miR156及其靶基因在蘿卜葉片中功能的驗證
為了分析miR156-SPL模塊在蘿卜葉片中的功能,研究進行了RsmiR156a-5p的瞬時過表達實驗。與野生型相比,過表達RsmiR156a-5p的植株葉片因帶有RUBY標簽而呈現紅色。qRT-PCR結果顯示,在三個獨立的過表達株系中,RsmiR156a-5p的表達均顯著上調。過表達miR156a-5p顯著抑制了靶基因RsSPL10和RsSPL15的表達水平,同時lncRNA RsLinc1162和RsLinc214的表達也下降。此外,過表達RsLinc214增加了RsSPL10和RsSPL15的表達水平,同時降低了RsmiR156a-5p的表達,但對RsLinc1162的表達無顯著影響。雙熒光素酶報告基因實驗進一步證實,miR156的共表達能顯著抑制含有RsSPL10或RsSPL15靶片段的報告基因的熒光素酶活性,表明miR156能夠直接靶向RsSPL10和RsSPL15并抑制其表達。
4 討論
4.1 蘿卜開花發育中鑒定的差異表達基因
從營養生長到生殖生長的轉變是蔬菜作物生長發育的關鍵事件。本研究在蘿卜中鑒定出5315個差異表達mRNA,并通過K-means聚類分析將其分為六個簇。許多已知的開花相關基因,如RsAGL18、RsFT、RsELF3、RsSPL15、RsSOC1、RsFLC類基因、RsSPL4、RsPIF4、RsCOL1、RsEMF2、RsCPK6和RsVIN3等,在這些簇中呈現差異表達,它們分別參與了光周期、春化、激素響應等多種開花調控途徑。GO富集分析也發現,許多DEG富集于與生殖過程、多生物過程、激素響應等相關的條目,這與簇1和簇3的分析結果一致。這些結果為深入探究蘿卜抽薹開花的分子機制提供了豐富的數據基礎。
4.2 lncRNA在蘿卜開花發育中的重要作用
越來越多的研究表明lncRNA在植物生長發育中扮演重要角色。本研究在蘿卜兩個發育階段共鑒定出263個差異表達lncRNA,且其表達水平普遍低于mRNA,這與之前在白菜和番茄中的報道相似。lncRNA可通過順式或反式作用調控基因表達。本研究發現84個和107個差異表達lncRNA分別對74個和96個差異表達mRNA具有潛在的順式和反式調控效應。許多與開花相關的基因,如SOC1,被預測受到多個lncRNA的順式或反式調控。參考擬南芥中COOLAIR、COLDAIR、FLORE和FLAIL等lncRNA在開花調控中的功能,本研究鑒定出的lncRNA及其靶基因很可能在蘿卜開花發育中發揮類似的調控作用。
4.3 調控蘿卜開花發育的miRNA及其靶向的lncRNA與mRNA
大量研究證實,miRNA通過切割或翻譯抑制其靶基因mRNA,在開花調控中發揮關鍵作用。本研究中,85個差異表達基因與31個差異表達miRNA呈負相關,其中包含miR156、miR399、miR824、miR172和miR169等已知的開花時間調控因子。研究重點驗證了miR156a-5p/SPL模塊的功能,發現瞬時過表達miR156a-5p能顯著抑制其靶基因RsSPL10和RsSPL15以及兩個lncRNA(RsLinc1162和RsLinc214)的表達。雙熒光素酶實驗進一步證明miR156能直接靶向并抑制RsSPL10和RsSPL15的表達,這表明miR156a-5p/SPL調控網絡在蘿卜開花發育中扮演重要角色。此外,miR399b與其靶基因RsFD、以及新發現的miRNA novel-23與其靶基因RsSOC1也呈現出負相關的差異表達模式,提示它們可能參與開花調控。
lncRNA可作為miRNA的前體或競爭性內源RNA(eTM)來調控miRNA的功能。本研究鑒定出32個差異表達miRNA與87個差異表達lncRNA在134個模塊中呈負相關,其中miR156-5p靶向12個lncRNA,miR172b-5p靶向1個lncRNA,novel-23靶向3個lncRNA。結合miRNA靶向的mRNA和lncRNA,研究成功構建了五個mRNA-lncRNA-miRNA調控網絡。這些對開花調控相關非編碼RNA網絡的全面鑒定與分析,為深入研究蘿卜開花時間的調控機制提供了寶貴的數據參考和候選基因。
5 結論
本研究對蘿卜營養生長和開花階段的mRNA、lncRNA和miRNA進行了全面系統的鑒定與分析。共鑒定出5315個差異表達基因、263個差異表達lncRNA和38個差異表達miRNA。通過聚類分析,發現了許多與生殖過程、多生物過程及激素響應相關的開花相關差異表達基因。研究預測了202個和257個差異表達lncRNA分別對572個和3902個差異表達mRNA具有潛在的順式和反式調控效應。此外,分別預測了93個和82個差異表達基因是31個和29個差異表達miRNA的潛在靶標。最終,構建了五個與開花時間調控相關的mRNA-lncRNA-miRNA調控網絡。這些發現為深入探索蘿卜抽薹開花的復雜調控機制提供了有價值的候選基因和非編碼RNA資源。