《Computers, Environment and Urban Systems》:Multi-frequency street-level urban noise modeling and mapping through street view and remote sensing image fusion
編輯推薦:
為解決傳統(tǒng)噪聲建模方法成本高、覆蓋有限且僅關(guān)注總聲壓級而忽略頻率特性的問題,本研究創(chuàng)新性地融合街景影像(SVI)與遙感影像(RSI),利用預(yù)訓(xùn)練視覺變換器架構(gòu)構(gòu)建多源融合模型,成功實現(xiàn)了珠海市香洲區(qū)街道尺度的多頻噪聲(100 Hz-16,000 Hz)暴露的精確建模與高分辨率(50 m)制圖。結(jié)果表明,融合模型預(yù)測精度高(R2達0.417-0.649),并揭示了建筑、道路、人行道和地形是影響噪聲預(yù)測的四個最重要視覺要素。該研究為精細化城市噪聲管理與健康導(dǎo)向的城市規(guī)劃提供了新方法支持。
城市噪聲污染已成為繼空氣污染和水污染之后的第三大環(huán)境健康威脅。無論是惱人的交通鳴笛,還是持續(xù)不斷的施工低頻震動,亦或是密集人群的交談聲,共同構(gòu)成了現(xiàn)代都市復(fù)雜而難以逃脫的“聲景”。長久暴露于高分貝噪聲環(huán)境,已被流行病學(xué)研究證實會顯著增加心血管疾病、睡眠障礙和心理壓力的風(fēng)險。因此,對城市噪聲暴露進行精確、大尺度的建模,是健康城市研究和精準治理面臨的關(guān)鍵科學(xué)挑戰(zhàn)。
傳統(tǒng)上,評估城市噪聲環(huán)境主要有三種途徑,但各有局限。第一種是部署固定或移動傳感器進行實地測量,這種方法精度高但成本巨大,難以大規(guī)模推廣。第二種是基于土地利用、建筑環(huán)境等靜態(tài)數(shù)據(jù),利用機器學(xué)習(xí)方法推斷噪聲,但這類模型難以捕捉動態(tài)的城市要素,在復(fù)雜多樣的城市環(huán)境中泛化能力不足。第三種是利用時空大數(shù)據(jù)進行間接估計,例如基于位置的噪聲投訴數(shù)據(jù)或街景影像。其中,街景影像憑借其公開可及、圖像內(nèi)容豐富、空間覆蓋度高等優(yōu)勢,已被廣泛應(yīng)用于大量城市研究中。然而,街景采樣的時間差異會受到隨機交通和行人流狀態(tài)的顯著影響,使得噪聲推斷易受“時間偏差”干擾,可能產(chǎn)生有偏的結(jié)論。例如,同一街道在交通高峰時段與平峰時段采集的影像中,車輛和行人所占像素比例差異巨大,可能導(dǎo)致模型無法收斂甚至得出矛盾結(jié)果。與此同時,現(xiàn)有研究提出的噪聲建模方法大多只能評估噪聲強度(分貝值),而城市聲景遠比單一的“響度”維度復(fù)雜多樣,不同頻率的聲波對人類產(chǎn)生的生理和行為影響各異。例如,重型卡車經(jīng)過時產(chǎn)生的低沉轟鳴(集中于低頻),與轎車、行人交談的聲音(集中于中高頻),即使分貝值相同,對人的影響也截然不同。這種對噪聲頻率特性的忽視,是當(dāng)前城市噪聲研究的一個重要空白。
為應(yīng)對上述挑戰(zhàn),一項發(fā)表在《Computers, Environment and Urban Systems》上的研究提出了一種創(chuàng)新的多源融合方法。該研究由香港中文大學(xué)太空與地球信息科學(xué)研究所的科研團隊完成。研究人員以中國珠海市香洲區(qū)為案例,巧妙地結(jié)合了街景影像的微觀視角和遙感影像的宏觀視角,旨在實現(xiàn)對城市街道尺度多頻真實噪聲暴露狀況的建模與制圖。
為了開展這項研究,研究人員整合了多種前沿技術(shù)方法。首先,他們通過志愿者騎行調(diào)查,采集了包含23個頻帶(100 Hz-16,000 Hz)的35,276條街道噪聲音頻作為地面真值數(shù)據(jù)。同時,系統(tǒng)采集了研究區(qū)內(nèi)約6000張街景影像及對應(yīng)的遙感影像。通過空間匹配,最終構(gòu)建了包含923個有效街景-噪聲配對樣本的數(shù)據(jù)集用于模型訓(xùn)練與驗證。在建模核心,研究基于預(yù)訓(xùn)練的視覺變換器(Vision Transformer, ViT)架構(gòu)構(gòu)建了多源融合模型,分別使用在大型網(wǎng)絡(luò)圖像數(shù)據(jù)集和衛(wèi)星圖像數(shù)據(jù)集上預(yù)訓(xùn)練的DINOv3模型,從街景影像和遙感影像中提取高維深度特征,并進行特征融合。此外,研究還采用了多種經(jīng)典的機器學(xué)習(xí)算法(如XGBoost、SVR等)進行對比實驗,并利用基于語義分割的街景要素提取結(jié)合SHAP(SHapley Additive exPlanations)可解釋性分析方法,來揭示影響噪聲預(yù)測的關(guān)鍵城市環(huán)境視覺要素。
3.1. 實驗采集的噪聲頻率分布分析
研究對沿一條騎行軌跡采集的噪聲數(shù)據(jù)進行了頻率分析。結(jié)果顯示,城市街道尺度的噪聲主要集中在中低頻段,這是城市交通噪聲的典型特征。低頻段(約250 Hz)的噪聲強度值更高、變異性更大,中位數(shù)一般維持在70-80 dB之間,這主要源于車輛發(fā)動機的低頻振動、輪胎與路面摩擦及車身共振等因素。隨著頻率升高,噪聲強度呈現(xiàn)明顯的下降趨勢。在高頻段(2000 Hz以上),噪聲強度顯著降低,中位數(shù)降至40-55 dB范圍內(nèi)。這種多頻譜噪聲的非均勻分布,凸顯了分頻段建模的必要性。
3.2. 模型性能比較與融合效果
研究評估了多種機器學(xué)習(xí)方法對整體A計權(quán)聲壓級(dBA)、低頻、中頻和高頻噪聲的預(yù)測性能。敏感性分析表明,圖像驅(qū)動的噪聲預(yù)測方法具有可靠性。以dBA預(yù)測為例,R2值在0.417至0.649之間,表現(xiàn)出中等至較高的預(yù)測性能。在不同緩沖區(qū)尺度下,基于遙感特征的方法隨緩沖區(qū)距離增大,預(yù)測精度逐步提高。在眾多模型中,支持向量回歸(SVR)和K最近鄰(KNN)在所有評估指標上 consistently 表現(xiàn)出優(yōu)越性能。其中,SVR模型結(jié)合遙感特征對平均噪聲的預(yù)測取得了最高的R2(0.649)。一個有趣的發(fā)現(xiàn)是,中頻噪聲在所有模型配置中都表現(xiàn)出最高的可預(yù)測性,這可能反映了中頻噪聲與普遍的交通流、商業(yè)運營等人為活動模式的強關(guān)聯(lián)性,而這些模式更容易被街景和遙感影像中的視覺特征捕捉。相比之下,低頻噪聲的預(yù)測挑戰(zhàn)最大。
3.3. 散點圖與預(yù)測空間分布分析
通過對比僅使用街景特征、僅使用遙感特征以及使用融合特征的模型預(yù)測結(jié)果,研究發(fā)現(xiàn)多源融合方法實現(xiàn)了最高的預(yù)測精度,其預(yù)測點最緊密地聚集在理想預(yù)測線周圍。而僅使用SVI特征的模型在高噪聲環(huán)境下預(yù)測偏差較大,體現(xiàn)了街景影像“時間偏差”的影響;僅使用RSI特征的模型雖然整體分布更穩(wěn)定,但缺乏捕捉細微噪聲變化的能力。空間制圖結(jié)果進一步顯示,融合模型在保留街景數(shù)據(jù)精細感知能力的同時,利用了遙感數(shù)據(jù)的空間一致性來降低預(yù)測的不確定性,生成了空間模式更均勻、一致且細節(jié)豐富的50米分辨率街道尺度多頻聲景圖。
3.4. 可解釋性學(xué)習(xí)結(jié)果
為提供可解釋的見解,研究采用了一種基于語義分割的可解釋建模方法。通過預(yù)訓(xùn)練的SegFormer模型對街景影像進行分割,提取了19類街道要素的像素比例,并基于XGBoost回歸擬合噪聲水平,最后利用SHAP的Tree Explainer量化了各街道要素對噪聲水平的貢獻。結(jié)果顯示,建筑、道路、人行道和地形是影響模型預(yù)測的四個最重要的視覺要素。部分依賴圖分析揭示了這些要素與噪聲水平之間的非線性關(guān)系,例如,更寬的道路通常與更高的噪聲水平相關(guān),而當(dāng)?shù)匦危ò肪壥⒕G化帶等)比例超過一定閾值時,其對噪聲產(chǎn)生抑制作用。
該研究成功構(gòu)建并驗證了一個多模態(tài)機器學(xué)習(xí)框架,通過融合街景影像的微觀視角和遙感影像的宏觀視角,在城市街道尺度的多頻譜噪聲預(yù)測與高分辨率制圖方面取得了重要突破。研究創(chuàng)新性地結(jié)合了兩種數(shù)據(jù)源的優(yōu)勢,有效克服了單一數(shù)據(jù)源的固有局限,不僅解決了街景影像的時間不穩(wěn)定性問題,也彌補了遙感影像在感知微觀社會經(jīng)濟活動方面的不足。
研究超越了傳統(tǒng)僅關(guān)注A計權(quán)總聲壓級的局限,揭示了城市噪聲主要由中低頻成分構(gòu)成,并實現(xiàn)了對低、中、高三個不同頻段噪聲的同步、準確預(yù)測。模型在不同聲景尺度上均達到了較高的預(yù)測精度,其中對中頻噪聲的預(yù)測精度尤為突出。研究成功生成了空間分辨率高達50米的街道尺度多頻聲景地圖,達到了前所未有的空間粒度。通過SHAP可解釋性分析,量化了建筑、道路、人行道等城市視覺要素對噪聲預(yù)測的貢獻,為城市規(guī)劃決策提供了科學(xué)依據(jù)。
與傳統(tǒng)的實地測量方法相比,該研究僅需街道對應(yīng)的街景影像和遙感影像,為城市聲環(huán)境監(jiān)測提供了一種成本低廉、可大規(guī)模應(yīng)用的新范式,在顯著降低數(shù)據(jù)采集成本的同時,實現(xiàn)了更廣闊的空間覆蓋。盡管在模型泛化能力和數(shù)據(jù)時效性方面仍有提升空間,但研究所構(gòu)建的方法框架具有良好的擴展性。未來可進一步集成動態(tài)交通數(shù)據(jù)、氣象條件等因素,構(gòu)建更全面的城市聲環(huán)境時空動態(tài)監(jiān)測系統(tǒng)。總之,該研究不僅在技術(shù)方法上實現(xiàn)了重要創(chuàng)新,也為精準的城市噪聲污染治理、公共健康政策制定以及健康城市建設(shè)提供了有力的科學(xué)支持工具和數(shù)據(jù)基礎(chǔ)。