編輯推薦:
本刊推薦:針對通用環流模型(GCM)在降水模擬,特別是極端降水和晝夜循環方面的顯著偏差,研究人員開展了一項基于可微分NeuralGCM框架的混合模型研究。該模型首次直接利用衛星降水觀測(IMERG)進行端到端訓練,在2.8°分辨率下運行,顯著優于CMIP6模型、ERA5再分析和全球云解析模型,并在中期降水預報中超越ECMWF集合預報系統。此項研究為利用觀測數據改進GCM提供了新范式,對提升當前氣候模擬可靠性具有重要意義。
降水,作為水循環的核心環節,對人類社會活動和自然生態系統具有至關重要的影響。然而,準確模擬降水,尤其是極端降水事件和其日變化特征,一直是氣候科學領域的巨大挑戰。傳統的通用環流模型(GCM)在這方面表現不佳,其模擬的降水偏差有時甚至與氣候變化本身帶來的預估變化幅度相當,這嚴重削弱了我們對未來區域氣候變化的預測信心,也制約了有效的氣候適應規劃。從CMIP5到CMIP6,盡管在減少降水偏差方面取得了一些進展,但在模擬極端高影響事件方面改善有限,凸顯了提升GCM降水模擬逼真度的迫切性。
當前GCM的降水偏差主要歸因于深對流參數化方案的缺陷。為解決此問題,科學家們探索了三種主要途徑:一是公里尺度的全球風暴解析模型,但其計算成本高昂,難以用于長期氣候模擬;二是純機器學習(ML)大氣模型,在短期預報中表現出色,但在長期降水統計方面尚未超越傳統GCM;三是結合機器學習與物理的混合模型,但以往的嘗試嚴重依賴高分辨率模擬數據而非直接觀測,且常面臨不穩定性、氣候漂移和大偏差等問題,導致其在真實氣候模擬中仍不具備競爭力。
在此背景下,一項發表于《SCIENCE ADVANCES》的研究帶來了突破。研究人員在可微分NeuralGCM框架的基礎上,開發了一種直接利用衛星降水觀測進行訓練的混合模型,顯著提升了降水模擬在氣候背景和天氣預報兩方面的技能。
為開展此項研究,研究人員主要應用了以下幾項關鍵技術:基于可微分動力核心和神經網絡參數化的混合建模框架,實現了端到端的在線訓練;利用IMERG V07衛星降水觀測和ERA5再分析數據作為訓練和驗證數據集;引入了基于大氣水柱守恒的物理約束,通過神經網絡預測降水率并診斷蒸發率;采用隨機訓練策略,逐步增加預報軌跡的滾動時長;使用連續分級概率評分(CRPS)等概率評估指標對模型性能進行量化。
訓練一個基于觀測的混合模型
研究的核心是NeuralGCM模型,它包含一個可微分動力核心和一個學習的物理模塊(即神經網絡參數化)。這種架構使得模型完全可微分,便于端到端訓練。與之前依賴ERA5數據訓練的NeuralGCM不同,本研究直接優化基于衛星的降水觀測(IMERG)。為了實現物理一致性和穩定性,研究者引入了關鍵修改,特別是通過一個神經網絡從大氣柱狀態預測降水率,并通過強制執行水柱守恒來診斷蒸發率。這解決了同時優化IMERG降水和ERA5水變量(比濕、云變量、蒸發率)時存在的目標沖突問題。
中期降水預報
在天氣預報方面,研究評估了NeuralGCM在2020年(訓練數據保留年)的732個初始條件下、50個成員的集合預報表現。結果顯示,在2.8°分辨率下,NeuralGCM在連續分級概率評分(CRPS)、集合平均均方根偏差(RMSB)、展寬技能比和布里爾評分(0.95分位數)等所有指標上,在15天預報期內均優于ECMWF集合預報系統(ENS)。這一優勢在針對IMERG和GPCP(未參與訓練)的24小時累積降水評估中均成立,并且在陸地區域的評估中也保持穩定。
氣候模擬中的降水
為了測試NeuralGCM在氣候模擬中的技能,研究進行了使用2001年37個初始條件的20年模擬,并規定了歷史海表溫度(SST)和海冰濃度。模型在多個方面與CMIP6模型、ERA5再分析數據和GFDL的X-SHiELD全球云解析模型進行了比較。
平均降水
分析顯示,與IMERG觀測相比,37個NeuralGCM模擬的全球平均絕對誤差(MAE)為0.45毫米/天,比37個CMIP6 AMIP實驗的0.74毫米/天誤差降低了40%。NeuralGCM的誤差與ERA5相當,但值得注意的是,NeuralGCM是自由運行的(僅受SST和海冰范圍強迫),而ERA5每12小時同化一次觀測。
極端降水和降水率分布
NeuralGCM在模擬熱帶地區24小時降水率的頻率分布方面,無論是弱降水還是極端降水,都比ERA5和代表性的CMIP6模型(如IPSL-CM6A-LR)更接近IMERG的分布。在模擬年最大日降水(Rx1day)的空間格局方面,NeuralGCM也比ERA5和CMIP6模型更準確,在陸地上的MAE比CMIP6模型降低了38%至55%。
降水的晝夜循環
在表征夏季降水晝夜循環方面,NeuralGCM在捕捉陸地降水質心時間上明顯優于ERA5和GFDL AMIP模擬。后兩者表現出眾所周知的“提前偏差”,降水峰值錯誤地出現在中午前后,而NeuralGCM將峰值推遲到下午晚些時候和傍晚,與觀測結果更為一致。在海洋區域,所有模型與觀測結果基本一致,都能捕捉到特征性的夜間或早晨降水最大值。
討論與結論
本研究展示了如何通過結合可微分動力核心和神經網絡參數化,使NeuralGCM能夠聯合在ERA5和觀測產品上訓練,為利用觀測知識提高大氣模擬逼真度提供了一個令人信服的范例。當在IMERG衛星降水數據上訓練時,NeuralGCM能夠進行十年尺度的穩定模擬,并在準確模擬降水的平均狀態、極端事件和晝夜循環等關鍵方面顯著優于傳統GCM和ERA5。此外,該模型計算效率極高,在單個張量處理單元(TPU)上每天可模擬約1200個模擬年,有利于大集合預報。
盡管存在模型分辨率較低、需要訓練多個模型以篩選穩定版本以及處理不同數據集間不一致性等局限性,但這項研究標志著在改進物理模型以更好地符合觀測方面邁出了重要一步。它證明了低分辨率混合模型在降水預測方面可以大幅超越先進的業務預報系統,并為未來利用可微分建模框架耦合傳統參數化方案并優化其參數,從而基于觀測數據改進物理模型開辟了道路。這項工作為發展更可靠的氣候模擬和天氣預報工具奠定了堅實的基礎,展示了將數據驅動方法與物理約束相結合的巨大潛力。