aV无码av高潮aV三区,嫩呦囯产一区二区三区,极品虎白一线天馒头最新消息

首頁今日動態人才市場新技術專欄中國科學人云展臺
BioHot
云講堂直播會展中心特價專欄技術快訊免費試用

生物通官微
陪你抓住生命科技
跳動的脈搏

生物通首頁 > 今日動態 > 正文

高維樣本熵有助于揭示數據中豐富的復雜結構

《Chaos, Solitons & Fractals》：High-dimensional sample entropy for uncovering rich complex structures in data

【字體：大中小】 時間：2026年03月02日 來源：Chaos, Solitons & Fractals 5.6

編輯推薦：

　　針對傳統熵測度在高維數據中因降維導致空間結構丟失的問題，提出高維樣本熵(HDSE)算法，通過多階相位空間重建直接在高維數據空間構建模板子塊，有效捕捉局部空間分布特征，并驗證其在合成數據與真實RGB圖像分類任務中的優越性。

文欣霞|方王

湘潭大學數學與計算科學學院，湘潭，411105，中國

摘要

隨著高維數據在復雜系統和實際應用中的廣泛出現，現有的單一維度熵度量及其二維擴展在捕捉高維數據的空間信息和揭示其復雜結構方面存在顯著局限性。為了解決這個問題，我們提出了高維樣本熵（HDSE），這是一種新型的熵算法，旨在系統地量化高維數據的復雜性和不確定性，同時建立一個統一的、不受維度限制的計算框架。該框架將熵分析擴展到任意維度的數據空間，從而避免了傳統方法中數據重塑和降維所導致的信息失真。HDSE 的核心創新在于通過引入多階相空間重建，直接在原始高維數據空間中構建模板子塊。這些子塊作為高維空間中的超立方體存在，能夠精確捕捉局部區域內數據的空間分布特征。實驗結果表明，HDSE 不僅在不同維度上的單調性在合成分數布朗運動數據中保持理論一致，而且在涉及三維混合過程模型的測試中，與其他方法相比表現出更優越的區分敏感性，驗證了其在理論嚴謹性和實際效果方面的優勢。此外，在使用 RGB 圖像數據對油菜品種進行分類時，從 HDSE 中提取的特征在多個評估指標上均優于二維方法。這一結果證實了 HDSE 保持高維數據中關鍵結構信息的能力，使其成為復雜系統中復雜性評估和模式識別的更強大分析工具。

引言

隨著傳感技術、成像技術和計算能力的快速發展，科學研究和工程實踐中獲取的數據不僅在規模上大幅增加，而且在形式和結構上也變得越來越復雜。其中，高維數據——指具有三個或更多維度的數據——已成為許多領域的主流數據形式。例如，在計算機視覺中，彩色圖像由像素組成，通常表示為具有高度、寬度和顏色通道的三維（3D）數據[1]；在醫學領域，功能性磁共振成像（fMRI）生成器官活動的三維甚至四維數據[2]；在氣象學和環境科學中，全球氣候模型輸出包含經度、緯度、海拔和時間在內的四維場數據[3]。這些數據包含決定系統狀態、功能和演變的關鍵信息，解析其復雜結構對于理解底層系統的動態機制至關重要。因此，有效測量高維數據的復雜性、提取其關鍵結構信息，并在保持原始數據結構的同時進行分析和處理，已成為當前數據科學和復雜系統研究的核心挑戰之一。

熵是一個源自信息論和熱力學的概念，已經發展成為衡量系統不確定性、隨機性和復雜性的關鍵指標[4]、[5]、[6]。從香農熵[7]到條件熵[8]，研究人員開發了適用于一維（1D）時間序列的各種熵度量方法。其中，近似熵（ApEn）[9]作為一種早期的重要工具，通過評估子序列之間的匹配概率來估計系統復雜性，但它嚴重依賴于序列長度，并且包含一種自我匹配機制，這在結果中引入了偏差。為了解決這些問題，樣本熵（SampEn）[10]在計算匹配子序列對的數量時明確排除了自我匹配，從而提高了計算的一致性和穩定性。近年來，通過持續的算法改進，SampEn 的性能得到了顯著提升，并已成功應用于多個領域。從基于 SampEn 的內在模態函數進行故障信號分類[11]，到使用基于振蕩的 SampEn 進行連續健康監測[12]，SampEn 作為一種優秀的非線性動態特征，及其改進的方法，能夠有效捕捉和量化由軸承部件損壞引起的振動信號中的微妙變化，顯著提高了狀態識別和早期預警的敏感性和準確性。通過多尺度分析，SampEn 還可以揭示不同尺度上時間序列的復雜性特征，從而提供更全面的系統狀態描述，這在識別水下目標輻射噪聲[13]和在混響背景下檢測船舶回波[14]方面顯示出顯著的效果。

在一維信號分析中，SampEn 由于其有效測量序列復雜性和規律性而在多個領域展示了重要價值。然而，當面對具有獨特結構特征的二維（2D）系統（如灰度圖像）時，一維 SampEn 難以表征它們的空間分布和方向特征。因此，研究人員逐漸將熵計算框架擴展到二維空間，開發了二維 SampEn[15]，該方法結合了像素的鄰域相關性和空間模式相似性。該方法通過定義二維嵌入窗口來評估圖像平面內不同圖像塊之間的相似性，從而更全面地反映圖像的紋理復雜性和結構信息。近年來，為了提高二維 SampEn 的計算效率和估計精度，研究引入了基于上置信界限和蒙特卡洛采樣的快速估計算法[16]，顯著減少了圖像塊匹配的計算負擔，同時確保了估計結果的統計可靠性，為處理大規模圖像數據提供了可行的方法。在應用方面，二維 SampEn 已幫助在醫學圖像分析中識別組織病理結構變化。例如，在由幅度和周期組成的二維特征空間中評估腦電圖（EEG）信號的 SampEn[17]，可以更詳細地捕捉大腦功能狀態的動態特征。

然而，當我們關注具有三個或更多維度的高維數據時，現有的熵度量系統暴露出根本性的局限性。盡管一維和二維 SampEn 在各自的領域取得了成功，但它們本質上是低維工具[18]。目前，處理高維數據的主流方法涉及降維或重塑。具體來說，高維數據通常被扁平化為一維長向量或二維矩陣，然后應用傳統的一維或二維熵計算方法。雖然這種方法在技術上是可行的，但它帶來了巨大的代價——它不可避免地破壞甚至扭曲了高維數據固有的空間結構信息。當一個三維體積數據集被扁平化為一個一維序列時，三維空間中原本相鄰的體素之間的空間相關性完全丟失，被序列中相距較遠的點所取代。數據的空間局部性、幾何配置和拓撲關系是高維數據所攜帶信息的核心組成部分，而粗略的降維會抹去這些關鍵特征[19]。我們將這種現象稱為傳統熵度量的“維度詛咒”，可能導致無法準確反映高維數據的內在復雜性。

為了從根本上解決上述問題，我們迫切需要一個能夠原生且統一處理任意維度數據的熵度量框架。該框架應直接在高維數據空間中操作，無需降維預處理，從而完全保留和量化空間結構復雜性。為此，本文創新性地提出了高維樣本熵（HDSE）。主要貢獻包括：

•
設計了一個統一的、不受維度限制的復雜性分析框架。HDSE 算法構建了一個適用于任意維度數據空間的通用計算框架。
•
引入了高維相似性度量。多階重建的設計忠實捕捉了局部區域數據的空間模式，克服了依賴數據重塑和降維的傳統熵度量的局限性，實現了高維數據的無損復雜性評估。
•
通過廣泛的模擬和案例研究，HDSE 與基于數據重塑的低維 SampEn 方法進行了嚴格的基準測試。多方面的結果一致證實了所提出方法的優越區分能力和魯棒性。

本文的其余部分組織如下：第 2 節介紹了 HDSE 的計算框架。第 3 節通過三個合成實驗系統驗證了 HDSE 的性能。第 4 節應用 HDSE 識別來自不同油菜品種的 RGB 圖像的復雜性，然后完成分類任務。第 5 節詳細討論了 HDSE 的優點。最后，第 6 節總結了本文。

章節片段

高維樣本熵

我們提出 HDSE 作為 SampEn 框架對任何維度數據的原則性擴展。將熵分析擴展到一維或二維之外是一個重大挑戰：如何在不扁平化數據的情況下定義、提取和比較高維空間中的有意義的局部模式，因為扁平化會扭曲其固有結構？核心難點不僅在于計算高維距離，還在于創建一個保持邏輯的統一數學框架

仿真實驗

在本節中，我們使用三個代表性模型評估了所提出的 HDSE 算法的性能：具有不同光譜特性的高維彩色噪聲、具有不同赫斯特指數的多通道二維分數布朗運動（fBm），以及包含確定性和隨機成分的三維混合過程。

應用于 RGB 圖像分類

在本節中，我們應用所提出的 HDSE 算法通過使用它們的 RGB 圖像來完成油菜品種分類任務。該數據集包含 11 個油菜品種，分別是 Yunyouza 52#、Yunyouza 37#、Yunyouza 15#、Dianyouguan A35#、Zheyou 51#、Zheyouza 59#、Zhenongyou 3#、Zheyouza 211#、Liangyou 99#、Liangyou 811# 和 Liangyou 9#。這 11 個品種依次表示為

L 1 ～ L 11

。每個類別包含 80 張 RGB 圖像樣本，圖像大小為

R^{192 \times 192 \times 3}

討論

通過合成和現實世界實驗系統驗證了所提出的 HDSE 框架后，我們現在討論兩個關鍵方面，這些方面闡明了其在復雜數據處理領域和實際應用中的貢獻。以下部分將探討關鍵算法參數的選擇，并隨后總結這項工作的主要進展。

結論

基于本文中呈現的全面研究，我們自信地得出結論，所提出的 HDSE 算法成功建立了一個新穎的、統一的、不受維度限制的框架，用于量化高維數據的復雜性。通過在原始高維數據空間內直接操作，并利用多階相空間重建構建模板子塊，HDSE 基本上克服了現有的一維和二維熵的關鍵局限性

CRediT 作者貢獻聲明

文欣霞：撰寫——原始草稿、驗證、方法論、正式分析。方王：撰寫——審閱與編輯、監督、項目管理、資金獲取、概念化。

利益沖突聲明

作者聲明他們沒有已知的競爭性財務利益或個人關系可能影響本文報告的工作。

致謝

所有作者感謝匿名審稿人和負責編輯的 Stefano Lepri 博士提出的建設性評論和建議。

這項工作部分得到了國家自然科學基金（授權號：12471489）、湖南省科技創新計劃（授權號：2025RC9007）、湖南省研究生科技創新項目（CN）（授權號：CX20250962）、111 項目（授權號：D23017）以及科學計劃的支持。

熱點排行

新聞專題

聯系信箱：

粵ICP備09063491號