《Computers & Industrial Engineering》:Multi-Graph Inductive Representation Learning for Large-Scale Urban Rail Demand Prediction under Disruptions
編輯推薦:
城市軌道交通(URT)網絡日益龐大,對起訖點(OD)需求進行精準預測是支持規劃、調度和車隊管理的關鍵。然而,現有模型難以應對網絡結構動態變化、多種時空依賴性混雜以及列車延誤/取消等運營不確定性。為此,研究人員開展了一項題為“Multi-Graph Inductive Representation Learning for Large-Scale Urban Rail Demand Prediction under Disruptions”的研究,提出一種名為mGraphSAGE的多圖歸納表示學習框架。該模型將每個OD對表示為多個圖中的節點,以捕捉不同的時空相關性,并顯式納入運營可靠性信息。實驗表明,該模型在哥本哈根URT系統的三個網絡規模上均優于基線,RMSE降低高達5%,證明了其在大型及受干擾URT環境下的適用性與魯棒性。
隨著城市不斷擴張,城市軌道交通(URT)網絡也日益龐大。準確的乘客起訖點(OD)需求預測,對于支持線路規劃、列車調度、車隊管理等運營決策至關重要,這直接關系到市民的生活質量、經濟生產效率和環境的可持續性。然而,現實中的預測任務充滿了挑戰:URT網絡結構復雜,乘客出行行為多變,而且OD需求數據存在嚴重的“部分可觀測性”——一次行程只有在其完成后才能被完整記錄,這意味著在預測時刻,我們掌握的信息可能是不完整的。更棘手的是,城市軌道交通的日常運營并非總是風平浪靜,列車延誤、班次取消等意外事件時有發生,這些運營不確定性會顯著影響乘客的出行選擇和行為模式,從而給需求預測帶來巨大波動。盡管基于圖神經網絡(GNN)的模型在交通預測中展現出潛力,但它們通常依賴單一的、預定義的空間圖,難以區分OD對之間不同類型的時空依賴關系,并且在應對大規模網絡和動態變化的拓撲結構時,其擴展性(可擴展性)也面臨考驗。為了填補這些研究空白,來自丹麥技術大學(DTU)的研究團隊提出了一種新穎的解決方案。
為了攻克上述難題,研究人員開發了一個名為mGraphSAGE(多圖歸納表示學習)的預測框架。其核心是利用圖歸納表示學習技術,為大規模URT網絡構建一個既具備可擴展性,又在各種運營可靠性場景下保持魯棒性的短期OD需求預測模型。關鍵技術方法包括:1) 多圖建模:不再使用單一圖,而是構建了四個互補的圖來刻畫OD對之間不同的時空與服務關聯,包括基于時間序列相似性的時序相關圖、基于OD對質心距離的空間圖,以及分別基于起點站和終點站距離的局部空間圖。2) 歸納式學習:采用GraphSAGE式的歸納學習范式,通過采樣和聚合鄰居節點的特征來學習節點表示,這使得模型能夠泛化到未見過的OD對或動態變化的網絡結構,無需重新訓練。3) 特征工程:除了利用歷史OD聚合需求(Xt)和已完成行程(Dt)來捕捉趨勢性和周期性,還獨創性地引入了12個與系統運營可靠性相關的特征(fs),如過去一小時內在起終點站各線路的列車數量、平均延誤和取消比例,以顯式建模運營中斷的影響。模型在涵蓋不同網絡規模的哥本哈根S-train系統真實數據上進行了驗證。
研究結果
- •
3.1. 研究問題與特征:本節明確了OD預測中部分可觀測性的挑戰,并定義了用于預測的輸入特征。核心是將每個時間間隔t的OD需求分解為已完成行程dti和從起點站出發但未完成的行程pto。模型利用過去8個時間間隔的聚合需求{Xt, ..., Xt-7}和已完成行程{Dt, ..., Dt-7}來捕捉短期趨勢,并結合星期幾(fw)、時間區間(ft)等特征捕捉日/周周期性。此外,還設計了節點ID特征(fid)和前述的12個運營可靠性特征(fs)。
- •
3.2. URT中的OD圖:本節闡述了本研究的圖構建思路。與傳統的將車站作為節點、客流量作為邊的網絡圖不同,本研究創新性地將每一個OD對本身建模為圖中的一個節點。這樣做顯著降低了圖的規模和復雜度,使得在大規模網絡上進行高效的節點(即OD對)級預測成為可能。
- •
3.3. mGraphSAGE模型:本節詳細介紹了所提出的模型。
- •
3.3.1. 建模OD對間的時空相關性:為全面捕捉關系,研究構建了四個圖:1) 基于動態時間規整(DTW)距離的時序相關圖(Gt),連接具有相似歷史需求模式的OD對;2) 基于OD對質心歐氏距離的質心距離圖(Gs),捕捉整體空間鄰近性;3) 基于起點站距離的起點距離圖(Go)和4)基于終點站距離的終點距離圖(Gd),用以捕捉局部空間關聯。
- •
3.3.2. 用于OD預測的多圖歸納學習:模型在四個圖上并行運行GraphSAGE層。對于每個節點(OD對),在每一層中,模型從其在不同圖中的鄰居節點采樣并聚合特征信息。這些從不同圖學習到的節點表示最終被拼接起來,通過一個全連接網絡進行融合,并輸出對下一個時間間隔的OD需求預測值。
- •
4. 計算實驗:通過在哥本哈根URT系統的大、中、小三種網絡規模數據集上的實驗,mGraphSAGE與多種基線模型(包括歷史平均、向量自回歸、LSTM、圖卷積網絡等)進行了比較。評估指標包括均方根誤差(RMSE)和平均絕對誤差(MAE)。結果表明,mGraphSAGE在所有網絡尺度上均 consistently(持續地)取得了最佳性能,RMSE最高降低了5%。特別是在包含運營中斷(延誤和取消)的場景下,mGraphSAGE的表現顯著優于其他模型,證明了其引入運營可靠性特征的有效性和模型整體的魯棒性。消融實驗進一步證實,多圖設計和運營可靠性特征的加入都對性能提升有重要貢獻。
研究結論與意義
本研究針對大規模城市軌道交通網絡中,在運營不確定性下的起訖點需求預測難題,提出了一個創新的多圖歸納表示學習框架mGraphSAGE。該研究的主要貢獻和結論包括:第一,提出了一種可擴展的歸納式OD對層級預測框架,將每個OD對表示為節點,能夠適應動態演化的網絡條件。第二,引入了多圖表示法,通過四個互補的圖捕捉了OD對之間不同的時空與服務依賴關系,實現了更具表達力的需求建模。第三,顯式地整合了運營可靠性信息(如列車延誤和取消),顯著提升了模型在受干擾運營條件下的預測魯棒性。實驗證明,該模型在真實城軌網絡數據上,在預測精度和魯棒性方面均優于現有的機器學習基線模型。
這項研究的意義在于,它推動了OD需求預測方法向更貼近實際運營環境的方向發展。mGraphSAGE框架不僅能夠處理大規模、復雜的網絡結構,還能有效應對日常運營中不可避免的中斷事件,為交通運營商提供更可靠、更及時的數據驅動決策支持。例如,基于更準確的短期OD預測,運營商可以更主動地管理列車時刻表和運力以應對擾動,通過動態資源分配優化運營效率,并通過減少過度擁擠和提供及時旅行信息來提升乘客體驗。該研究發表于《Computers 》期刊,為構建更具韌性(resilience)和適應性的城市軌道交通系統提供了有力的方法論工具。