va精品,中文字幕第4页,人妻少妇精品视频一区二区三区

首頁今日動態人才市場新技術專欄中國科學人云展臺
BioHot
云講堂直播會展中心特價專欄技術快訊免費試用

生物通官微
陪你抓住生命科技
跳動的脈搏

生物通首頁 > 今日動態 > 正文

基于特征優化和兩階段集成學習方法，對隧道施工過程中涌水情況進行智能預測

《Engineering Applications of Artificial Intelligence》：Intelligent prediction of tunnel water inflow during construction based on feature optimization and two-stage ensemble learning

【字體：大中小】 時間：2026年02月27日 來源：Engineering Applications of Artificial Intelligence 8

編輯推薦：

　　隧道涌水預測面臨多維度特征耦合、模型泛化不足及解釋性差等問題。本研究提出融合特征優化與兩階段集成學習的智能預測框架：首先基于隨機森林篩選關鍵特征（貢獻度≥95%），其次構建六種異構基模型（如XGBoost、LightGBM）的集成架構，通過決策樹實現預測融合，并可視化決策路徑揭示特征-響應機制。驗證表明，相較傳統模型，預測精度提升14.6%-45.4%，在復雜地質條件下仍保持強泛化能力與工程實用性。

姚夏一|黃明莉|史法順|于柳城|方英然

教育部城市地下工程重點實驗室，北京交通大學，北京，100044，中國

摘要

長期以來，隧道施工過程中水流入的準確預測一直受到三個關鍵挑戰的阻礙：顯著的多維特征耦合效應、模型泛化能力不足以及解釋性差。為了解決這些問題，本研究提出了一個結合特征優化和兩階段集成學習的智能預測框架。該方法包括三個主要組成部分。首先，使用隨機森林算法識別關鍵預測因子，從而有效評估特征相關性。其次，通過集成六個異構的基礎學習器構建基于堆疊的集成架構來提取多模式特征，并通過元級決策樹模型進行預測融合。第三，通過可視化決策樹節點分裂來實現模型解釋性，揭示控制隧道水流入的特征-響應機制。使用來自山區隧道項目的現場監測數據進行驗證表明，所提出的框架顯著提高了預測精度，與傳統基線模型相比，均方根誤差降低了14.6%–45.4%，同時在地質不確定性條件下表現出強大的泛化能力。解釋性分析提供的明確決策路徑為施工階段的風險預防和控制提供了實際指導，證實了該框架在計算可靠性和工程應用性方面的優勢。

引言

近年來，交通基礎設施的持續擴展推動了隧道建設向地質條件日益復雜、埋藏深度更大的山區發展（Dong等人，2023年）。在這種環境下進行隧道挖掘時，突然的水流入已成為最常見的危險地質問題之一。這些事件可能導致嚴重的傷亡和經濟損失，同時也會對施工安全和周圍環境構成重大威脅，從而阻礙隧道項目的安全高效實施（Dong等人，2023年；Jin等人，2025年；Xiang等人，2023年）。全球范圍內嚴重的隧道水流入事故頻繁發生，進一步凸顯了準確預測水流入的重要性，以降低施工風險并支持隧道施工期間的有效規劃和管理（He等人，2023年）。

在過去幾十年中，已經開發了多種預測隧道水流入的方法，包括分析方法、經驗方法、數值方法和基于人工智能的方法。分析方法通常基于理論模型，如鏡像法、復雜函數法和球坐標變換（Wang等人，2021年；Xiang等人，2023年；Zhang等人，2020年）。這些方法計算效率高且簡單直觀，但它們依賴于關于幾何形狀和地下水條件的簡化假設，這限制了它們在復雜水文地質環境（如裂隙巖體）中的應用。隨著施工環境變得越來越復雜，這些方法的局限性變得更加明顯。經驗方法可以提供水流入量的定性或定量估計，包括地下水分類、隧道流入分級和滲流率計算（Maleki，2018年；Ostad-Ali-Askari等人，2017年；Zarei等人，2013年）。數值方法，如有限元法、有限差分法和離散元法，在模擬復雜水文地質過程方面非常有效（Long和Tan，2020年）。然而，這些方法通常需要詳細的水文地質數據和模型簡化，導致數據采集成本高且在工程應用中的實用性有限。

隨著計算機技術的進步，由于機器學習方法具有高預測精度和強大的適應性，它們在隧道工程中的應用日益增多（Mahmoodzadeh等人，2021年）。在隧道水流入預測方面，一些研究探索了不同的機器學習模型。Shucai Li等人首次引入高斯過程回歸（GPR）進行隧道水流入預測，并證明了其相對于人工神經網絡和支持向量回歸的優越性能（Li等人，2017年）。隨后，Arsalan Mahmoodzadeh等人應用了多種模型，包括長短期記憶網絡、深度神經網絡、K最近鄰算法、GPR和支持向量回歸（SVR）來預測隧道水流入（Mahmoodzadeh等人，2021年）。然而，大多數這些研究依賴于單一模型結構，這些模型往往難以捕捉多源水文地質參數之間的強非線性耦合，導致泛化能力有限和預測性能不穩定。

為了進一步提高預測精度，一些研究引入了模型優化或混合策略。Shi Chen和Shuning Dong開發了一個結合變分模態分解、抗異常極端學習機和多目標灰狼優化器的混合模型，提高了預測性能（Chen和Dong，2020年）。Jian Zhou等人提出了一種結合灰狼優化和隨機森林（RF）的模型，用于施工過程中的隧道水流入預測（Mahmoodzadeh等人，2022年；Zhou等人，2023年）。此外，基于基因表達編程的模型也顯示出了有希望的結果（Mahmoodzadeh等人，2024年）。盡管取得了這些進展，大多數現有方法仍然關注單一模型或單層優化，而對多模型協作學習的系統研究仍然有限。此外，這些模型的決策過程往往解釋不足，這限制了它們的實際工程應用性。

集成學習結合了具有不同學習機制的多個模型，提供了一種有效的方法來克服單一模型的局限性，并在精度、穩定性和泛化能力方面表現出優勢。集成學習的成功應用已在隧道巖體分類（Shahani等人，2022年）和巖爆強度預測（Sun等人，2024年）中得到報道。然而，在隧道水流入預測方面，同時考慮特征優化和集成建模的集成框架仍然缺乏，且此類模型的明確設計指南尚未完全建立。

特征選擇是直接影響機器學習模型預測性能和計算效率的關鍵步驟。在隧道工程研究中，特征選擇方法從早期基于皮爾遜相關性和相關矩陣的統計篩選方法（Kannangara等人，2022年；Wang等人，2023年）發展到更先進的框架，這些框架結合了基于隨機森林的重要性評估、遞歸特征消除、貝葉斯推斷和SHapley加性解釋（SHAP）分析（Shi等人，2024年；Song等人，2024年；Xiang等人，2023年）。這些方法在識別關鍵水文地質因素和一定程度上提高預測精度方面顯示出潛力。然而，在隧道水流入預測中，特征選擇通常被視為一個獨立的預處理步驟，并未與集成模型的設計和學習機制有效協調，其在整個多模型集成框架中的角色及其對預測性能和計算效率的綜合影響尚未得到充分探索。

模型解釋性對于提高機器學習方法的透明度和工程可靠性至關重要，并在隧道工程中受到了越來越多的關注。現有研究主要集中在基于模型的內在解釋和事后分析，包括基于極端梯度提升（XGB）和極端隨機樹的解釋，用于解釋沉降和巖爆機制（Shi等人，2024年；Wang等人，2023年），以及基于因果推理和SHAP的全局或局部特征貢獻分析（Jin等人，2025年；Kannangara等人，2022年；Kilic等人，2023年）。還探索了替代模型和混合解釋策略來提高解釋性（Chen等人，2023年；Li和Dias，2024年；Wang等人，2023年）。盡管取得了這些進展，大多數現有研究仍然關注單一模型，而對集成學習模型的系統解釋性分析——特別是關于如何整合多個基礎學習器的預測結果以及如何在不同層次上形成決策——仍然有限。對于高風險的工程問題（如隧道水流入預測），模型的透明度對于實際應用和決策支持至關重要。

基于上述研究空白，本研究提出了一種通過結合特征優化和兩階段集成學習框架來預測施工過程中隧道水流入的智能方法。首先使用RF算法對特征貢獻進行排序，從而識別關鍵控制因素并減少特征冗余。隨后，開發了一種基于堆疊的兩階段集成結構，其中多個異構的基礎學習器協同提高預測精度和穩定性，同時采用決策樹（DT）作為元學習器來有效融合預測結果。此外，通過可視化DT節點分裂來解釋模型的決策過程，揭示特征變量與水流入響應之間的關系。通過同時提高預測性能和解釋性，所提出的方法為復雜水文地質條件下的隧道水流入風險預測和施工決策提供了實用可靠的解決方案。

章節摘錄

特征集介紹

特征貢獻是一個關鍵指標，用于衡量每個特征變量對目標變量的影響程度。為了研究影響隧道水流入的因素，本研究回顧了工程案例研究和相關文獻，列出了可能影響水流入的特征，如表1所示。基于這些特征，構建了一個綜合特征集，其中包括：隧道深度（D）、覆蓋層厚度、從上覆斷裂帶到...

基于兩階段集成學習的水流入預測

根據特征貢獻排名結果，選擇了關鍵特征進行進一步分析。由于單一模型在提取復雜特征方面的局限性，它們的預測性能和魯棒性存在固有瓶頸。因此，為了實現更科學和準確的預測，本研究提出了一種可解釋的兩階段集成學習模型，旨在提高隧道施工過程中的水流入預測性能。

預測工程實踐中的水流入故障

本節使用一個真實的隧道施工案例來驗證所提出的兩階段集成方法的有效性。進行了比較分析，以證明其優越的預測性能和強大的解釋性。所有模型均在基于Python 3.12編程語言的PyCharm 2023.3.7開發環境中實現。執行系統為Windows，硬件配置為Intel(R) Core(TM) i7-14700HX @ 5.50 GHz CPU和16 GB內存

結論

本研究提出并驗證了一種基于特征優化和兩階段集成學習的隧道水流入預測方法。對中國西部山區隧道工程數據集進行的系統實驗得出了以下關鍵發現：

(1)

特征優化機制：使用隨機森林（RF）的雙標準篩選技術（基尼系數-排列準確性）識別出WYP、UG、AT、WH、RSO和RQD作為關鍵控制因素（累積貢獻≥95%）。

CRediT作者貢獻聲明

姚夏一：撰寫——原始草案、驗證、方法論、調查、形式分析、概念化。黃明莉：撰寫——審閱與編輯、資源管理、項目協調、資金獲取、概念化。史法順：撰寫——審閱與編輯、方法論、數據管理。于柳城：撰寫——審閱與編輯、可視化、數據管理。方英然：可視化、數據管理。

利益沖突聲明

作者聲明他們沒有已知的競爭財務利益或個人關系可能影響本文報告的工作。

致謝

本工作得到了中國國家鐵路集團有限公司科學技術研究與發展計劃的支持。（編號：P2019G055）。

熱點排行

新聞專題

聯系信箱：

粵ICP備09063491號