国产精品123,久久久久中文字幕,www.99热

基于街景與遙感影像融合的街道尺度城市多頻噪聲建模與制圖

《Computers, Environment and Urban Systems》：Multi-frequency street-level urban noise modeling and mapping through street view and remote sensing image fusion

【字體：大中小】 時間：2026年03月02日 來源：Computers, Environment and Urban Systems 8.3

編輯推薦：

　　為解決傳統(tǒng)噪聲建模方法成本高、覆蓋有限且僅關(guān)注總聲壓級而忽略頻率特性的問題，本研究創(chuàng)新性地融合街景影像(SVI)與遙感影像(RSI)，利用預(yù)訓(xùn)練視覺變換器架構(gòu)構(gòu)建多源融合模型，成功實現(xiàn)了珠海市香洲區(qū)街道尺度的多頻噪聲(100 Hz-16,000 Hz)暴露的精確建模與高分辨率(50 m)制圖。結(jié)果表明，融合模型預(yù)測精度高(R2達0.417-0.649)，并揭示了建筑、道路、人行道和地形是影響噪聲預(yù)測的四個最重要視覺要素。該研究為精細化城市噪聲管理與健康導(dǎo)向的城市規(guī)劃提供了新方法支持。

城市噪聲污染已成為繼空氣污染和水污染之后的第三大環(huán)境健康威脅。無論是惱人的交通鳴笛，還是持續(xù)不斷的施工低頻震動，亦或是密集人群的交談聲，共同構(gòu)成了現(xiàn)代都市復(fù)雜而難以逃脫的“聲景”。長久暴露于高分貝噪聲環(huán)境，已被流行病學(xué)研究證實會顯著增加心血管疾病、睡眠障礙和心理壓力的風(fēng)險。因此，對城市噪聲暴露進行精確、大尺度的建模，是健康城市研究和精準治理面臨的關(guān)鍵科學(xué)挑戰(zhàn)。

傳統(tǒng)上，評估城市噪聲環(huán)境主要有三種途徑，但各有局限。第一種是部署固定或移動傳感器進行實地測量，這種方法精度高但成本巨大，難以大規(guī)模推廣。第二種是基于土地利用、建筑環(huán)境等靜態(tài)數(shù)據(jù)，利用機器學(xué)習(xí)方法推斷噪聲，但這類模型難以捕捉動態(tài)的城市要素，在復(fù)雜多樣的城市環(huán)境中泛化能力不足。第三種是利用時空大數(shù)據(jù)進行間接估計，例如基于位置的噪聲投訴數(shù)據(jù)或街景影像。其中，街景影像憑借其公開可及、圖像內(nèi)容豐富、空間覆蓋度高等優(yōu)勢，已被廣泛應(yīng)用于大量城市研究中。然而，街景采樣的時間差異會受到隨機交通和行人流狀態(tài)的顯著影響，使得噪聲推斷易受“時間偏差”干擾，可能產(chǎn)生有偏的結(jié)論。例如，同一街道在交通高峰時段與平峰時段采集的影像中，車輛和行人所占像素比例差異巨大，可能導(dǎo)致模型無法收斂甚至得出矛盾結(jié)果。與此同時，現(xiàn)有研究提出的噪聲建模方法大多只能評估噪聲強度（分貝值），而城市聲景遠比單一的“響度”維度復(fù)雜多樣，不同頻率的聲波對人類產(chǎn)生的生理和行為影響各異。例如，重型卡車經(jīng)過時產(chǎn)生的低沉轟鳴（集中于低頻），與轎車、行人交談的聲音（集中于中高頻），即使分貝值相同，對人的影響也截然不同。這種對噪聲頻率特性的忽視，是當(dāng)前城市噪聲研究的一個重要空白。

為應(yīng)對上述挑戰(zhàn)，一項發(fā)表在《Computers, Environment and Urban Systems》上的研究提出了一種創(chuàng)新的多源融合方法。該研究由香港中文大學(xué)太空與地球信息科學(xué)研究所的科研團隊完成。研究人員以中國珠海市香洲區(qū)為案例，巧妙地結(jié)合了街景影像的微觀視角和遙感影像的宏觀視角，旨在實現(xiàn)對城市街道尺度多頻真實噪聲暴露狀況的建模與制圖。

為了開展這項研究，研究人員整合了多種前沿技術(shù)方法。首先，他們通過志愿者騎行調(diào)查，采集了包含23個頻帶(100 Hz-16,000 Hz)的35,276條街道噪聲音頻作為地面真值數(shù)據(jù)。同時，系統(tǒng)采集了研究區(qū)內(nèi)約6000張街景影像及對應(yīng)的遙感影像。通過空間匹配，最終構(gòu)建了包含923個有效街景-噪聲配對樣本的數(shù)據(jù)集用于模型訓(xùn)練與驗證。在建模核心，研究基于預(yù)訓(xùn)練的視覺變換器(Vision Transformer, ViT)架構(gòu)構(gòu)建了多源融合模型，分別使用在大型網(wǎng)絡(luò)圖像數(shù)據(jù)集和衛(wèi)星圖像數(shù)據(jù)集上預(yù)訓(xùn)練的DINOv3模型，從街景影像和遙感影像中提取高維深度特征，并進行特征融合。此外，研究還采用了多種經(jīng)典的機器學(xué)習(xí)算法（如XGBoost、SVR等）進行對比實驗，并利用基于語義分割的街景要素提取結(jié)合SHAP（SHapley Additive exPlanations）可解釋性分析方法，來揭示影響噪聲預(yù)測的關(guān)鍵城市環(huán)境視覺要素。

3.1. 實驗采集的噪聲頻率分布分析

研究對沿一條騎行軌跡采集的噪聲數(shù)據(jù)進行了頻率分析。結(jié)果顯示，城市街道尺度的噪聲主要集中在中低頻段，這是城市交通噪聲的典型特征。低頻段（約250 Hz）的噪聲強度值更高、變異性更大，中位數(shù)一般維持在70-80 dB之間，這主要源于車輛發(fā)動機的低頻振動、輪胎與路面摩擦及車身共振等因素。隨著頻率升高，噪聲強度呈現(xiàn)明顯的下降趨勢。在高頻段（2000 Hz以上），噪聲強度顯著降低，中位數(shù)降至40-55 dB范圍內(nèi)。這種多頻譜噪聲的非均勻分布，凸顯了分頻段建模的必要性。

3.2. 模型性能比較與融合效果

研究評估了多種機器學(xué)習(xí)方法對整體A計權(quán)聲壓級(dBA)、低頻、中頻和高頻噪聲的預(yù)測性能。敏感性分析表明，圖像驅(qū)動的噪聲預(yù)測方法具有可靠性。以dBA預(yù)測為例，R²值在0.417至0.649之間，表現(xiàn)出中等至較高的預(yù)測性能。在不同緩沖區(qū)尺度下，基于遙感特征的方法隨緩沖區(qū)距離增大，預(yù)測精度逐步提高。在眾多模型中，支持向量回歸(SVR)和K最近鄰(KNN)在所有評估指標上 consistently 表現(xiàn)出優(yōu)越性能。其中，SVR模型結(jié)合遙感特征對平均噪聲的預(yù)測取得了最高的R²（0.649）。一個有趣的發(fā)現(xiàn)是，中頻噪聲在所有模型配置中都表現(xiàn)出最高的可預(yù)測性，這可能反映了中頻噪聲與普遍的交通流、商業(yè)運營等人為活動模式的強關(guān)聯(lián)性，而這些模式更容易被街景和遙感影像中的視覺特征捕捉。相比之下，低頻噪聲的預(yù)測挑戰(zhàn)最大。

3.3. 散點圖與預(yù)測空間分布分析

通過對比僅使用街景特征、僅使用遙感特征以及使用融合特征的模型預(yù)測結(jié)果，研究發(fā)現(xiàn)多源融合方法實現(xiàn)了最高的預(yù)測精度，其預(yù)測點最緊密地聚集在理想預(yù)測線周圍。而僅使用SVI特征的模型在高噪聲環(huán)境下預(yù)測偏差較大，體現(xiàn)了街景影像“時間偏差”的影響；僅使用RSI特征的模型雖然整體分布更穩(wěn)定，但缺乏捕捉細微噪聲變化的能力。空間制圖結(jié)果進一步顯示，融合模型在保留街景數(shù)據(jù)精細感知能力的同時，利用了遙感數(shù)據(jù)的空間一致性來降低預(yù)測的不確定性，生成了空間模式更均勻、一致且細節(jié)豐富的50米分辨率街道尺度多頻聲景圖。

3.4. 可解釋性學(xué)習(xí)結(jié)果

為提供可解釋的見解，研究采用了一種基于語義分割的可解釋建模方法。通過預(yù)訓(xùn)練的SegFormer模型對街景影像進行分割，提取了19類街道要素的像素比例，并基于XGBoost回歸擬合噪聲水平，最后利用SHAP的Tree Explainer量化了各街道要素對噪聲水平的貢獻。結(jié)果顯示，建筑、道路、人行道和地形是影響模型預(yù)測的四個最重要的視覺要素。部分依賴圖分析揭示了這些要素與噪聲水平之間的非線性關(guān)系，例如，更寬的道路通常與更高的噪聲水平相關(guān)，而當(dāng)?shù)匦危ò肪壥⒕G化帶等）比例超過一定閾值時，其對噪聲產(chǎn)生抑制作用。

該研究成功構(gòu)建并驗證了一個多模態(tài)機器學(xué)習(xí)框架，通過融合街景影像的微觀視角和遙感影像的宏觀視角，在城市街道尺度的多頻譜噪聲預(yù)測與高分辨率制圖方面取得了重要突破。研究創(chuàng)新性地結(jié)合了兩種數(shù)據(jù)源的優(yōu)勢，有效克服了單一數(shù)據(jù)源的固有局限，不僅解決了街景影像的時間不穩(wěn)定性問題，也彌補了遙感影像在感知微觀社會經(jīng)濟活動方面的不足。

研究超越了傳統(tǒng)僅關(guān)注A計權(quán)總聲壓級的局限，揭示了城市噪聲主要由中低頻成分構(gòu)成，并實現(xiàn)了對低、中、高三個不同頻段噪聲的同步、準確預(yù)測。模型在不同聲景尺度上均達到了較高的預(yù)測精度，其中對中頻噪聲的預(yù)測精度尤為突出。研究成功生成了空間分辨率高達50米的街道尺度多頻聲景地圖，達到了前所未有的空間粒度。通過SHAP可解釋性分析，量化了建筑、道路、人行道等城市視覺要素對噪聲預(yù)測的貢獻，為城市規(guī)劃決策提供了科學(xué)依據(jù)。

與傳統(tǒng)的實地測量方法相比，該研究僅需街道對應(yīng)的街景影像和遙感影像，為城市聲環(huán)境監(jiān)測提供了一種成本低廉、可大規(guī)模應(yīng)用的新范式，在顯著降低數(shù)據(jù)采集成本的同時，實現(xiàn)了更廣闊的空間覆蓋。盡管在模型泛化能力和數(shù)據(jù)時效性方面仍有提升空間，但研究所構(gòu)建的方法框架具有良好的擴展性。未來可進一步集成動態(tài)交通數(shù)據(jù)、氣象條件等因素，構(gòu)建更全面的城市聲環(huán)境時空動態(tài)監(jiān)測系統(tǒng)。總之，該研究不僅在技術(shù)方法上實現(xiàn)了重要創(chuàng)新，也為精準的城市噪聲污染治理、公共健康政策制定以及健康城市建設(shè)提供了有力的科學(xué)支持工具和數(shù)據(jù)基礎(chǔ)。

相關(guān)新聞

生物通微信公眾號

微信

新浪微博

我要投稿

搜索
國際
國內(nèi)
人物
產(chǎn)業(yè)
熱點
科普

知名企業(yè)招聘

熱點排行

新聞專題