提升年度尺度顯著波高預測能力:對M5P決策樹方法的全面性能評估
《Ocean Engineering》:Advancing annual-scale significant wave height prediction: A comprehensive skill assessment of M5P decision tree approach
【字體:
大
中
小
】
時間:2026年02月28日
來源:Ocean Engineering 5.5
編輯推薦:
年尺度風浪顯著高度預測中M5p決策樹模型的優化與應用研究,基于ERA5再分析數據,通過對比決策樹分析法和向后剔除法進行特征選擇,發現風速是最關鍵預測因子,月度數據分割可將均方根誤差降低30%,限制樹深至5層可兼顧可解釋性與預測精度,模型在12個月預報中RMSE降至0.059,相關系數達0.998,較未包含風速的傳統模型性能更優,為海事安全、能源開發等提供高效可解釋的預測工具。
孫振航|王思思|王麗君
廣東海洋大學船舶與海洋工程學院,中國廣東省湛江市524088
摘要
準確預測年度尺度上的顯著風浪高度對于海上安全、海岸管理和可再生能源應用至關重要。盡管機器學習和數值模型提供了強大的工具,但它們的復雜性和計算需求往往限制了實際應用。本研究評估了M5p決策樹這種計算效率高且易于解釋的替代方法,使用來自北太平洋的ERA5再分析數據來預測風浪的顯著高度。特征選擇通過決策樹分析進行,并與向后消除法進行了比較。結果表明,風速是最有影響力的預測因子,按月份對數據進行分段可以提高模型性能,使均方根誤差(RMSE)降低多達30%,并提高預測準確性。將樹深度限制在5層可以提高可解釋性,同時保持相似的預測準確性。使用月度數據分段的M5P決策樹模型表現最佳,其RMSE值低至0.059,相關系數為0.998,而排除風速的模型的RMSE值分別為0.130和0.989。研究表明,M5P決策樹提供了一種實用、可解釋且高效的風浪高度預測方法,在準確性和計算效率方面均優于傳統模型。
引言
波高預測在海洋工程、海岸作業、海洋可再生能源提取和氣候研究中至關重要。顯著波高(SWH)影響海上平臺的安全、海岸侵蝕緩解、波浪轉換器的性能以及船舶航線(Ahmed等人,2022;Gao等人,2023;Yeganeh-Bakhtiary等人,2023b)。長期波高估計對于理解氣候變化對海洋條件的影響尤為重要(Ali和Prasad,2019)。年度尺度的波預測有助于評估氣候模式對沉積物輸送、海灘侵蝕和海上能源產生的影響(Shamshirband等人,2020;Yeganeh-Bakhtiary等人,2023c)。可靠的年度尺度預測對于港口作業、疏浚活動、海上建設(Dodet等人,2019);航運和漁業(DeMott等人,2021);風能和波浪能發電場支持(Hosseinzadeh等人,2023;Song等人,2023;Gao等人,2025);以及海岸線管理和防洪策略(Fontán-Bouzas等人,2022)的季節性調整是必要的。
已經開發了多種波高預測方法,大致分為經驗方法、統計方法、數值方法和基于機器學習(ML)的方法。基于觀測和回歸的經驗和統計模型已被用于根據歷史數據集簡化波高預測(Abbasi,2019;Salah,2017)。雖然這些方法計算成本較低,但它們在捕捉非線性相互作用和復雜波浪現象方面存在局限性(De Gracia等人,2019;Yeganeh-Bakhtiary等人,2023c)。
數值波預測模型,如WAM(Wamdi Group,1988)、SWAN(Booij等人,1999)和WW3(Tolman,1991,2009),已被廣泛用于波高預測。這些模型整合了風、流速和水深數據,提供了廣泛空間和時間尺度上的可靠波高預測(Zhang等人,2019)。然而,計算強度高、依賴大量氣象數據、近岸性能差以及在水深變化迅速的區域難以進行高分辨率預測,限制了這些模型的應用(Behnood等人,2017;Blaifi等人,2018;Karniadakis等人,2021;Mehrabi等人,2021;Rudin,2019)。
機器學習通過解決數值和經驗方法的局限性,徹底改變了波高預測。人工神經網絡(ANN)、支持向量機(SVM)和長短期記憶(LSTM)等技術展示了卓越的準確性和適應性(Shamshirband等人,2020)。這些方法利用歷史數據集和氣象輸入來提高預測準確性(Pedregosa等人,2011;Hu等人,2020;Sarker,2021)。此外,深度學習模型,如ConvLSTM,結合了空間和時間數據,提高了預測準確性,特別是在短期預測方面(Song等人,2022)。然而,基于ML的方法面臨重大挑戰,包括過擬合風險(Shi等人,2015)和缺乏可解釋性(Wang等人,2021)。
M5p決策樹(DT)是一種混合ML模型,它將決策樹與線性回歸相結合,使其在波高預測中非常有效(Jrab等人,2024)。這種結構使M5P DT能夠有效建模非線性關系,同時提供可解釋的線性方程(Dastourani等人,2013)。與提到的ML模型不同,M5P DT提供了一種結構化、可解釋的方法,同時保持計算效率(Sadeghifar等人,2022)。M5P DT能夠處理多種輸入類型,利用了其他多種模型的優勢,使其成為開發預測模型的強大工具。這種靈活性增強了其在不同數據集和復雜預測任務中的適用性,進一步提高了其在數據驅動決策中的實用性(Nourani和Molajou,2017)。最近的研究證明了M5P DT在氣候參數預測中的有效性(Nourani等人,2019a)。Nhu等人(2020)使用M5p預測了伊朗Zrebar湖的每日水位。Yeganeh-Bakhtiary等人(2022)應用M5P DT預測未來氣候變化情景下的氣象條件。Yeganeh-Bakhtiary等人(2023a)在另一項研究中使用M5P DT預測了未來的降雨和溫度趨勢。此外,M5P DT還應用于波浪能開發和河流交匯處的沖刷深度預測(Balouchi等人,2015)。
然而,M5p在年度尺度波預測中的應用仍然很大程度上未得到探索。本研究旨在通過評估M5P DT在1個月、3個月、6個月和12個月的中期時間尺度上的預測能力來填補這一研究空白。本研究利用M5p決策樹(M5P DT)模型,使用北太平洋的ERA5再分析數據來評估年度尺度上的顯著風浪高度(SHWW)預測及其相關性。詳細的研究方法,包括特征選擇、場景設計(數據劃分和DT深度)和模型評估,在第2節中介紹。
與許多專注于最大化短期預測準確性的機器學習研究不同,本研究旨在提供工程視角的見解,探討數據量、時間組織和模型復雜性如何共同影響年度尺度波預測能力。因此,本研究的新穎之處不在于算法修改,而在于為長期波預測應用中部署可解釋的決策樹模型建立實用指南。因此,本研究沒有引入額外的機器學習基準,因為此類比較超出了定義的范圍。在本研究中,“年度尺度預測”指的是長達一年的預測范圍(1-12個月),而不是多年氣候變異性的分析。重點是在工程和運營建模框架內,評估模型行為、魯棒性和預測能力,從月度到年度尺度逐漸增加。
研究方法
研究方法
M5P DT是一種多功能且強大的工具,可用于氣候和波高預測,它在準確性、可解釋性和計算效率之間取得了平衡。本研究首先使用M5P DT選擇重要特征,然后根據“數據分離”和“樹深度”兩種情景預測風浪的顯著高度。模型的開發和評估使用了ERA5再分析數據,并通過各種方法進行了評估
結果與討論
本節展示了基于數據分段和決策樹深度的特征選擇步驟和場景分析的結果。
結論
本研究全面評估了M5P DT模型在年度尺度SHWW預測方面的性能,重點關注特征選擇、數據分段和模型復雜性。
本研究在當前文獻的基礎上,通過將重點從基于準確性的模型競爭轉向工程導向的模型行為分析,推動了波高預測的研究進展。盡管許多近期研究優先考慮使用復雜ML架構的短期預測性能,但
CRediT作者貢獻聲明
孫振航:寫作——審稿與編輯、可視化、軟件、資源、方法論、調查。王思思:寫作——審稿與編輯、資源、方法論、調查、正式分析、數據整理。王麗君:寫作——初稿撰寫、監督、項目管理、資金獲取、正式分析、概念化。
資助
本工作部分得到了國家自然科學基金(資助編號:52171346、52571405和52271361)、廣東省南海海洋養殖智能裝備重點實驗室(資助編號:2023B1212030003)以及廣東省普通高校重點領域項目(資助編號:2024ZDZX3054)的支持。
利益沖突聲明
作者聲明沒有已知的競爭性財務利益或個人關系可能影響本文所述的工作。
生物通微信公眾號
生物通新浪微博
今日動態 |
人才市場 |
新技術專欄 |
中國科學人 |
云展臺 |
BioHot |
云講堂直播 |
會展中心 |
特價專欄 |
技術快訊 |
免費試用
版權所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
聯系信箱:
粵ICP備09063491號