洪水是最具破壞性的自然災(zāi)害之一,對(duì)可持續(xù)發(fā)展構(gòu)成重大威脅(Rentschler等人,2022年;Rogers等人,2025年)。到2030年,全球每年因洪水造成的平均經(jīng)濟(jì)損失將達(dá)到1360億美元(世界銀行集團(tuán),2022年),約1.32億人將面臨洪水災(zāi)害(Ward等人,2020年)。洪水風(fēng)險(xiǎn)不僅受物理災(zāi)害的影響,還受人口和基礎(chǔ)設(shè)施等脆弱要素的暴露程度的影響(Tate等人,2021年)。傳統(tǒng)評(píng)估主要利用遙感和靜態(tài)社會(huì)經(jīng)濟(jì)數(shù)據(jù)(如人口統(tǒng)計(jì)數(shù)據(jù)和土地利用信息)來確定洪水淹沒區(qū)域(Fang等人,2021年;Smith等人,2019年)。盡管這些基于物理的方法能有效繪制潛在風(fēng)險(xiǎn)地圖,但它們無法捕捉公眾在事件發(fā)生期間對(duì)洪水風(fēng)險(xiǎn)的真實(shí)感知(Rajput等人,2024年)。最近的研究表明,公眾感知的洪水風(fēng)險(xiǎn)(PPFR),即個(gè)人體驗(yàn)和解讀的洪水強(qiáng)度和影響,在推動(dòng)個(gè)人應(yīng)急響應(yīng)、影響社會(huì)穩(wěn)定以及最終決定災(zāi)害損失方面起著關(guān)鍵作用(Al Mamun等人,2025年;Brown等人,2018年)。因此,增強(qiáng)對(duì)PPFR的理解對(duì)于準(zhǔn)確的洪水評(píng)估和有效的洪水管理至關(guān)重要。
傳統(tǒng)上,PPFR是通過社會(huì)調(diào)查、問卷調(diào)查和訪談來評(píng)估的(Abass等人,2022年)。盡管這些方法提供了有價(jià)值的信息,但在快速變化的災(zāi)害情況下,它們往往具有有限的時(shí)間分辨率和空間覆蓋范圍(Zhao等人,2025a)。隨著Web 2.0的到來,社交媒體數(shù)據(jù)為捕捉PPFR提供了新的途徑(Peng和Zhang,2024年)。與傳統(tǒng)數(shù)據(jù)相比,社交媒體數(shù)據(jù)具有較高的時(shí)空分辨率(Wang等人,2020年;Yan等人,2024年)。在洪水事件期間,人們經(jīng)常在X(前身為Twitter)、Facebook和Weibo等社交媒體平臺(tái)上發(fā)布求助信息或記錄他們的經(jīng)歷(Huang等人,2022年)。這使得社交媒體成為捕捉PPFR的有效渠道。
社交媒體數(shù)據(jù)已廣泛應(yīng)用于洪水相關(guān)研究,包括洪水監(jiān)測(cè)和預(yù)警(Shoyama等人,2021年)、災(zāi)害演變分析(Abedin等人,2024年)以及災(zāi)后損失評(píng)估(Hao和Wang,2020年)。然而,大多數(shù)研究?jī)H關(guān)注單一災(zāi)害階段,缺乏對(duì)多個(gè)階段公眾感知災(zāi)害風(fēng)險(xiǎn)的系統(tǒng)比較。新興證據(jù)表明,此類風(fēng)險(xiǎn)在不同階段存在顯著差異,并表現(xiàn)出明顯的時(shí)間動(dòng)態(tài)(Q. Guo等人,2025年)。因此,對(duì)公眾感知災(zāi)害風(fēng)險(xiǎn)的全面評(píng)估必須考慮階段間差異及其時(shí)間演變。
然而,通過社交媒體數(shù)據(jù)分析公眾感知的災(zāi)害風(fēng)險(xiǎn)的一個(gè)重大挑戰(zhàn)是提取受影響地點(diǎn)(Kim和Hastak,2018年)。傳統(tǒng)方法通常構(gòu)建特定領(lǐng)域的詞典并應(yīng)用字符串匹配來識(shí)別地點(diǎn)實(shí)體(Smith等人,2017年)。但由于災(zāi)害場(chǎng)景的多樣性和漢語的語言復(fù)雜性,這些基于規(guī)則的方法普遍適用性有限,語義理解能力較弱(Roy等人,2021年)。近年來,預(yù)訓(xùn)練模型(如雙向編碼器表示BERT)憑借深度語義表示和上下文理解能力,能夠更準(zhǔn)確地從社交媒體文本中提取與災(zāi)害相關(guān)的地點(diǎn)實(shí)體(Devlin等人,2019年)。例如,Yan等人(2024年)對(duì)BERT進(jìn)行了微調(diào),從微博帖子中提取與洪水相關(guān)的地點(diǎn)實(shí)體,實(shí)現(xiàn)了城市尺度上的精細(xì)情境感知和洪水演變跟蹤。因此,本研究采用基于BERT的框架從社交媒體數(shù)據(jù)中識(shí)別與洪水相關(guān)的地點(diǎn)實(shí)體。
評(píng)估影響因素對(duì)PPFR的異質(zhì)性效應(yīng)是另一個(gè)挑戰(zhàn),因?yàn)檫@些知識(shí)支持差異化和精細(xì)化的洪水管理策略(Tellman等人,2021年)。傳統(tǒng)的洪水影響評(píng)估通常依賴于線性假設(shè)(Guo等人,2026年),使用基于指數(shù)的評(píng)估方法(Gu和Liu,2024年)、廣義線性回歸(Zhang等人,2020年)、主成分分析(Abdrabo等人,2023年)和空間計(jì)量模型(H. Wang等人,2024a)。然而,影響因素與PPFR之間的關(guān)系往往是非線性的(Li等人,2025年;Zhao等人,2024年)。近年來,機(jī)器學(xué)習(xí)(ML)方法已廣泛應(yīng)用于洪水相關(guān)研究中的非線性建模。這些模型可以捕捉復(fù)雜的關(guān)系,而無需預(yù)先定義的功能形式,并能自動(dòng)從大規(guī)模異構(gòu)數(shù)據(jù)中提取特征(Zhu等人,2024年)。
盡管ML可以捕捉洪水建模中的非線性效應(yīng),但其“黑箱”特性限制了模型的可解釋性(Kim和Kim,2022年)。最近在可解釋人工智能(XAI)方面的進(jìn)展提供了提高模型透明度的新方法(Jiang等人,2024年)。根據(jù)可解釋性的范圍,XAI方法通常分為全局可解釋性和局部可解釋性。前者評(píng)估預(yù)測(cè)因子對(duì)模型輸出的總體影響,而后者解釋每個(gè)因素對(duì)個(gè)別預(yù)測(cè)的貢獻(xiàn)(Zhang等人,2022年)。在這些方法中,Shapley加性解釋(SHAP)因其同時(shí)支持全局和局部可解釋性而被廣泛采用(Qiu等人,2026年;Shapley,2020年)。然而,SHAP在空間可解釋性方面存在顯著局限性(Li等人,2022年,Li等人,2024年,Li等人,2025年)。先前的研究表明,影響因素對(duì)洪水風(fēng)險(xiǎn)的影響在地理空間上存在差異(Li等人,2024b)。為了克服這一局限性,采用了GeoShapley方法,該方法在模型解釋中明確納入地理坐標(biāo)作為聯(lián)合空間特征,從而能夠量化空間效應(yīng)(Li,2024年)。在此基礎(chǔ)上,通過將ML模型與GeoShapley結(jié)合,開發(fā)了地理空間可解釋人工智能(GeoXAI)框架,以全面捕捉PPFR建模中的非線性效應(yīng)和空間異質(zhì)性。
本研究的目標(biāo)有四個(gè):(i) 使用社交媒體數(shù)據(jù)量化不同洪水階段的PPFR并描述其時(shí)空模式;(ii) 基于微調(diào)的BERT開發(fā)一個(gè)兩階段深度學(xué)習(xí)框架,用于從社交媒體中提取與洪水相關(guān)的地點(diǎn)實(shí)體;(iii) 介紹一個(gè)GeoXAI框架,用于評(píng)估影響因素在不同階段對(duì)PPFR的非線性效應(yīng)和空間異質(zhì)性;(iv) 確定每個(gè)階段影響PPFR的關(guān)鍵因素。