《Computers, Environment and Urban Systems》:Forging EMPIRE: A data-driven agent-based model for scenario-based generalizability in spatio-temporal human behavior modeling
編輯推薦:
本文針對當(dāng)前建筑環(huán)境設(shè)計中,傳統(tǒng)基于代理的模型(ABM)過度簡化人類行為的動態(tài)性和適應(yīng)性,導(dǎo)致模型在跨場景泛化能力上的不足。作者提出EMPIRE框架,該框架集成了模仿學(xué)習(xí)(IL)、強化學(xué)習(xí)(RL)和圖神經(jīng)網(wǎng)絡(luò)(GNN),構(gòu)建了一個數(shù)據(jù)驅(qū)動、分層的時空行為預(yù)測模型。通過在公園場景下的案例研究,證明EMPIRE能夠成功地將學(xué)習(xí)到的行為模式遷移到新的空間布局中,為設(shè)計以人為本的響應(yīng)式環(huán)境提供了新工具。
我們花費了大約90%的時間生活在建筑環(huán)境中——我們的家、辦公室、公園、交通系統(tǒng)。這些環(huán)境的設(shè)計,深刻地影響著從獲取機會、公共健康到社會資本形成和應(yīng)對突發(fā)中斷的韌性等個體和社區(qū)的福祉。然而,盡管建筑、交通等基礎(chǔ)設(shè)施越來越多地由數(shù)據(jù)和計算模型指導(dǎo),但這些模型常常過度簡化了它們旨在服務(wù)的主體——人類。它們通常賦予代理人以靜態(tài)或假定的行為規(guī)則,無法捕捉現(xiàn)實世界行為的動態(tài)、適應(yīng)性和情境敏感的本質(zhì)。這個持續(xù)的建模差距,限制了我們設(shè)計真正能夠支持有意義的人類和社區(qū)成果的空間的能力。
特別是在社會基礎(chǔ)設(shè)施(如公園、圖書館、交通樞紐)中,其布局、可見性和可供性常常未能支持那些形成信任和互惠基礎(chǔ)的、隨意的、重復(fù)的互動。因此,即使物理基礎(chǔ)設(shè)施存在,其社會功能也未能實現(xiàn)。這揭示了一個關(guān)鍵的設(shè)計缺陷。同樣,在醫(yī)療保健環(huán)境的仿真模型中,人類運動常常被描繪為統(tǒng)一和可預(yù)測的,嚴(yán)格遵循預(yù)定時間表;在疏散和人群仿真中,基于細(xì)胞自動機的方法難以表示異構(gòu)的決策策略和精細(xì)空間配置的影響。這類簡化忽視了個人差異和動態(tài)互動,而這些因素恰恰會顯著影響結(jié)果(如護(hù)理質(zhì)量、疏散效率)。
為了突破這些限制,來自卡內(nèi)基梅隆大學(xué)的Maral Doctorarastoo、Katherine A. Flanigan、Mario Bergés和Christopher McComb在《Computers, Environment and Urban Systems》期刊上發(fā)表了他們的研究成果,提出了一個名為EMPIRE(Empirical Modeling of People in Responsive Environments,響應(yīng)式環(huán)境中的人的實證建模)的新框架。這個框架旨在構(gòu)建一個數(shù)據(jù)驅(qū)動的、分層的模型,用于預(yù)測動態(tài)物理環(huán)境中的人類時空行為,其核心目標(biāo)是實現(xiàn)基于場景的泛化能力。EMPIRE的靈感來源于認(rèn)知科學(xué)、環(huán)境心理學(xué)和機器學(xué)習(xí)對人類決策認(rèn)知特性的見解,其結(jié)構(gòu)是分層的,頂部是戰(zhàn)略規(guī)劃,底部是執(zhí)行規(guī)劃。
為了開展這項研究,研究人員在EMPIRE框架中整合了多種關(guān)鍵技術(shù)。首先,他們采用了模仿學(xué)習(xí)來從現(xiàn)場數(shù)據(jù)中學(xué)習(xí)人類的高級戰(zhàn)略活動(如下一步做什么活動,持續(xù)多久),避免使用手工制定的啟發(fā)式規(guī)則。其次,他們利用強化學(xué)習(xí)來生成基于環(huán)境解釋和偏好的適應(yīng)性執(zhí)行策略,使代理能夠通過試錯在與動態(tài)環(huán)境的交互中學(xué)習(xí)最優(yōu)行動。最后,為了捕捉個體在執(zhí)行同一活動時的獨特偏好(例如,一個人可能喜歡陽光照射的座位,而另一個人則尋求陰涼處),他們引入了圖神經(jīng)網(wǎng)絡(luò)。GNN能夠?qū)體感知到的空間特征、環(huán)境條件、附近人員及其相互關(guān)系進(jìn)行編碼,從而為每個個體生成一個位置特異性的“合意性”表面,這個表面作為RL規(guī)劃的獎勵景觀。這三層(IL, GNN, RL)共同構(gòu)成了代理的“決策核心”,在訓(xùn)練階段分別使用不同的數(shù)據(jù)流(粗粒度和細(xì)粒度數(shù)據(jù))進(jìn)行獨立訓(xùn)練,在仿真階段則緊密耦合,形成一個閉環(huán)決策循環(huán)。
框架概覽與核心組件
本研究提出的EMPIRE框架包含兩個主要階段:訓(xùn)練階段和仿真階段。在訓(xùn)練階段,傳感器網(wǎng)絡(luò)從儀器化環(huán)境中收集多模態(tài)觀測數(shù)據(jù),并將其處理為粗粒度和細(xì)粒度兩種數(shù)據(jù)流,分別用于訓(xùn)練戰(zhàn)略規(guī)劃(IL)、偏好建模(GNN)和執(zhí)行力規(guī)劃(RL)模型。在仿真階段,訓(xùn)練好的代理決策核心被部署到模擬環(huán)境中,代理根據(jù)當(dāng)前觀察,通過IL選擇活動,GNN生成獎勵圖,RL決定具體行動,形成一個動態(tài)交互的閉環(huán)系統(tǒng)。該框架將環(huán)境抽象為物理空間、社會空間和環(huán)境空間三個相互關(guān)聯(lián)的部分,并使用規(guī)則網(wǎng)格世界進(jìn)行表示以實現(xiàn)計算可操作性。
案例研究:口袋公園中的行為模擬
為了驗證EMPIRE的場景泛化能力,研究團隊進(jìn)行了一項案例研究,模擬人類在代表性社會基礎(chǔ)設(shè)施(口袋公園)中的行為。研究中并未使用真實的人類觀測數(shù)據(jù),而是采用了受已有工作啟發(fā)、基于詳細(xì)規(guī)則生成的合成行為數(shù)據(jù)作為“真實軌跡”。他們設(shè)計了六個不同的公園布局,并采用“留一布局”交叉驗證策略進(jìn)行評估,即每次使用五個布局的數(shù)據(jù)訓(xùn)練模型,然后在第六個未見過的布局上進(jìn)行測試。
模型評估與泛化性能
研究對EMPIRE在每個被保留的公園布局中的性能進(jìn)行了系統(tǒng)評估,將模擬的代理行為與合成的真實軌跡數(shù)據(jù)進(jìn)行比較。實驗結(jié)果表明,EMPIRE成功地將學(xué)習(xí)到的行為模式遷移到了新的、未見過的空間場景中。這證明了其分層架構(gòu)(戰(zhàn)略目標(biāo)穩(wěn)定,執(zhí)行策略自適應(yīng))和GNN對空間關(guān)系編碼的有效性,共同賦予了模型強大的場景泛化能力。具體性能指標(biāo)在論文相關(guān)部分給出。
研究結(jié)論與意義
本研究的核心貢獻(xiàn)在于提出了EMPIRE這一創(chuàng)新的、數(shù)據(jù)驅(qū)動的人類時空行為建模框架。該框架通過分層集成模仿學(xué)習(xí)、圖神經(jīng)網(wǎng)絡(luò)和強化學(xué)習(xí),巧妙地模擬了人類“戰(zhàn)略規(guī)劃-偏好評估-執(zhí)行調(diào)整”的決策過程。其關(guān)鍵優(yōu)勢在于:
- 1.
數(shù)據(jù)驅(qū)動與實證基礎(chǔ):通過IL和GNN直接從(合成)數(shù)據(jù)中學(xué)習(xí)行為模式和個體偏好,減少了對人工制定規(guī)則的依賴,提高了模型的真實性。
- 2.
強大的場景泛化能力:分層的模塊化設(shè)計使得高級行為目標(biāo)(由IL學(xué)習(xí))能夠相對穩(wěn)定地跨場景遷移,而低級的執(zhí)行策略(由RL學(xué)習(xí))可以靈活適應(yīng)新的空間布局和社會動態(tài)。GNN對圖結(jié)構(gòu)關(guān)系的捕捉進(jìn)一步增強了模型對未知空間配置的適應(yīng)力。這在“留一布局”測試中得到了驗證。
- 3.
可解釋性與模塊性:決策過程被分解為戰(zhàn)略、偏好、執(zhí)行三個相對清晰的層次,增加了模型的可理解性。同時,每一層理論上都可以用更先進(jìn)的算法替代,保持了框架的靈活性和未來擴展性。
這項工作表明,將人類重新定位為動態(tài)系統(tǒng)的驅(qū)動者和受益者,并利用先進(jìn)的機器學(xué)習(xí)技術(shù)構(gòu)建具有適應(yīng)性和泛化能力的行為模型,是可能的。EMPIRE框架為建筑環(huán)境、城市規(guī)劃、應(yīng)急管理乃至虛擬現(xiàn)實等領(lǐng)域,提供了一個強大的新工具,用于模擬和預(yù)測復(fù)雜、動態(tài)的人類-環(huán)境互動,從而支持設(shè)計出更加人性化、高效和富有韌性的空間與系統(tǒng)。未來的工作可以探索在真實觀測數(shù)據(jù)上訓(xùn)練和驗證EMPIRE,并將其應(yīng)用于更廣泛的領(lǐng)域和更復(fù)雜的多智能體交互場景中。