近年來,交通基礎設施的持續擴展推動了隧道建設向地質條件日益復雜、埋藏深度更大的山區發展(Dong等人,2023年)。在這種環境下進行隧道挖掘時,突然的水流入已成為最常見的危險地質問題之一。這些事件可能導致嚴重的傷亡和經濟損失,同時也會對施工安全和周圍環境構成重大威脅,從而阻礙隧道項目的安全高效實施(Dong等人,2023年;Jin等人,2025年;Xiang等人,2023年)。全球范圍內嚴重的隧道水流入事故頻繁發生,進一步凸顯了準確預測水流入的重要性,以降低施工風險并支持隧道施工期間的有效規劃和管理(He等人,2023年)。
在過去幾十年中,已經開發了多種預測隧道水流入的方法,包括分析方法、經驗方法、數值方法和基于人工智能的方法。分析方法通常基于理論模型,如鏡像法、復雜函數法和球坐標變換(Wang等人,2021年;Xiang等人,2023年;Zhang等人,2020年)。這些方法計算效率高且簡單直觀,但它們依賴于關于幾何形狀和地下水條件的簡化假設,這限制了它們在復雜水文地質環境(如裂隙巖體)中的應用。隨著施工環境變得越來越復雜,這些方法的局限性變得更加明顯。經驗方法可以提供水流入量的定性或定量估計,包括地下水分類、隧道流入分級和滲流率計算(Maleki,2018年;Ostad-Ali-Askari等人,2017年;Zarei等人,2013年)。數值方法,如有限元法、有限差分法和離散元法,在模擬復雜水文地質過程方面非常有效(Long和Tan,2020年)。然而,這些方法通常需要詳細的水文地質數據和模型簡化,導致數據采集成本高且在工程應用中的實用性有限。
隨著計算機技術的進步,由于機器學習方法具有高預測精度和強大的適應性,它們在隧道工程中的應用日益增多(Mahmoodzadeh等人,2021年)。在隧道水流入預測方面,一些研究探索了不同的機器學習模型。Shucai Li等人首次引入高斯過程回歸(GPR)進行隧道水流入預測,并證明了其相對于人工神經網絡和支持向量回歸的優越性能(Li等人,2017年)。隨后,Arsalan Mahmoodzadeh等人應用了多種模型,包括長短期記憶網絡、深度神經網絡、K最近鄰算法、GPR和支持向量回歸(SVR)來預測隧道水流入(Mahmoodzadeh等人,2021年)。然而,大多數這些研究依賴于單一模型結構,這些模型往往難以捕捉多源水文地質參數之間的強非線性耦合,導致泛化能力有限和預測性能不穩定。
為了進一步提高預測精度,一些研究引入了模型優化或混合策略。Shi Chen和Shuning Dong開發了一個結合變分模態分解、抗異常極端學習機和多目標灰狼優化器的混合模型,提高了預測性能(Chen和Dong,2020年)。Jian Zhou等人提出了一種結合灰狼優化和隨機森林(RF)的模型,用于施工過程中的隧道水流入預測(Mahmoodzadeh等人,2022年;Zhou等人,2023年)。此外,基于基因表達編程的模型也顯示出了有希望的結果(Mahmoodzadeh等人,2024年)。盡管取得了這些進展,大多數現有方法仍然關注單一模型或單層優化,而對多模型協作學習的系統研究仍然有限。此外,這些模型的決策過程往往解釋不足,這限制了它們的實際工程應用性。
集成學習結合了具有不同學習機制的多個模型,提供了一種有效的方法來克服單一模型的局限性,并在精度、穩定性和泛化能力方面表現出優勢。集成學習的成功應用已在隧道巖體分類(Shahani等人,2022年)和巖爆強度預測(Sun等人,2024年)中得到報道。然而,在隧道水流入預測方面,同時考慮特征優化和集成建模的集成框架仍然缺乏,且此類模型的明確設計指南尚未完全建立。
特征選擇是直接影響機器學習模型預測性能和計算效率的關鍵步驟。在隧道工程研究中,特征選擇方法從早期基于皮爾遜相關性和相關矩陣的統計篩選方法(Kannangara等人,2022年;Wang等人,2023年)發展到更先進的框架,這些框架結合了基于隨機森林的重要性評估、遞歸特征消除、貝葉斯推斷和SHapley加性解釋(SHAP)分析(Shi等人,2024年;Song等人,2024年;Xiang等人,2023年)。這些方法在識別關鍵水文地質因素和一定程度上提高預測精度方面顯示出潛力。然而,在隧道水流入預測中,特征選擇通常被視為一個獨立的預處理步驟,并未與集成模型的設計和學習機制有效協調,其在整個多模型集成框架中的角色及其對預測性能和計算效率的綜合影響尚未得到充分探索。
模型解釋性對于提高機器學習方法的透明度和工程可靠性至關重要,并在隧道工程中受到了越來越多的關注。現有研究主要集中在基于模型的內在解釋和事后分析,包括基于極端梯度提升(XGB)和極端隨機樹的解釋,用于解釋沉降和巖爆機制(Shi等人,2024年;Wang等人,2023年),以及基于因果推理和SHAP的全局或局部特征貢獻分析(Jin等人,2025年;Kannangara等人,2022年;Kilic等人,2023年)。還探索了替代模型和混合解釋策略來提高解釋性(Chen等人,2023年;Li和Dias,2024年;Wang等人,2023年)。盡管取得了這些進展,大多數現有研究仍然關注單一模型,而對集成學習模型的系統解釋性分析——特別是關于如何整合多個基礎學習器的預測結果以及如何在不同層次上形成決策——仍然有限。對于高風險的工程問題(如隧道水流入預測),模型的透明度對于實際應用和決策支持至關重要。
基于上述研究空白,本研究提出了一種通過結合特征優化和兩階段集成學習框架來預測施工過程中隧道水流入的智能方法。首先使用RF算法對特征貢獻進行排序,從而識別關鍵控制因素并減少特征冗余。隨后,開發了一種基于堆疊的兩階段集成結構,其中多個異構的基礎學習器協同提高預測精度和穩定性,同時采用決策樹(DT)作為元學習器來有效融合預測結果。此外,通過可視化DT節點分裂來解釋模型的決策過程,揭示特征變量與水流入響應之間的關系。通過同時提高預測性能和解釋性,所提出的方法為復雜水文地質條件下的隧道水流入風險預測和施工決策提供了實用可靠的解決方案。