<tt id="vwe5b"></tt>
      1. <tfoot id="vwe5b"><progress id="vwe5b"></progress></tfoot><abbr id="vwe5b"></abbr>

      2. 91人人妻,99偷拍,碰碰免费视频,亚洲中文字幕AV,丝袜a片,91纯肉动漫,中文无码日,伊人福利导航

        利用自編碼器正則化實現(xiàn)多維數(shù)據(jù)的參數(shù)化與可逆投影學習

        《Computers & Graphics》:Single pass Poisson disk sampling via circle packing

        【字體: 時間:2026年03月02日 來源:Computers & Graphics 2.8

        編輯推薦:

          為解決傳統(tǒng)降維方法(如t-SNE和UMAP)普遍不具備參數(shù)化和可逆性,限制了其在動態(tài)數(shù)據(jù)集擴展和交互式數(shù)據(jù)生成中的應(yīng)用這一難題,本研究深入探索并評估了基于自編碼器的三種神經(jīng)網(wǎng)絡(luò)架構(gòu)。研究人員通過引入特定的正則化方法,成功學習了與給定二維投影對齊的潛在空間,不僅能高精度地參數(shù)化嵌入新數(shù)據(jù)點,還能平滑地從投影空間反演出高維樣本。結(jié)果表明,特別當采用KL散度正則化時,所提方法在保持高質(zhì)量重構(gòu)的同時,允許用戶靈活控制投影的平滑度,為分類器評估和反事實生成等應(yīng)用提供了強大的交互式生成模型。

          
        在當今數(shù)據(jù)驅(qū)動的科學研究中,如何將高維數(shù)據(jù)可視化,以便人類直觀地洞察其內(nèi)在結(jié)構(gòu)和模式,是一個永恒的核心挑戰(zhàn)。像t-SNE和t-分布隨機鄰域嵌入t-SNE)以及UMAP(Uniform Manifold Approximation and Projection)這樣的降維技術(shù),已成為將復(fù)雜數(shù)據(jù)映射到二維或三維空間的利器,廣泛應(yīng)用于生物信息學、醫(yī)學影像分析等領(lǐng)域。然而,這些主流方法存在一個根本性缺陷:它們通常是“一次性”的計算。想象一下,當你獲得一個漂亮的二維點云圖后,如果來了新的數(shù)據(jù)樣本,你無法簡單地將其添加到現(xiàn)有圖上,而必須將所有新舊數(shù)據(jù)混在一起重新計算整個投影,耗時耗力且可能導(dǎo)致圖譜“漂移”。更棘手的是,現(xiàn)有的投影圖就像一個“單向鏡”——你只能從高維看低維,卻無法反過來從圖中任意一點“生成”或“解讀”出其對應(yīng)的高維樣本是什么樣子。這種缺乏“參數(shù)化”和“可逆性”的特性,極大地限制了降維工具在動態(tài)數(shù)據(jù)分析、交互式探索以及合成數(shù)據(jù)生成等場景中的應(yīng)用潛力。
        為了打破這一僵局,來自康斯坦茨大學的研究團隊將目光投向了強大的神經(jīng)網(wǎng)絡(luò),特別是自編碼器架構(gòu)。他們提出并系統(tǒng)評估了三種創(chuàng)新的神經(jīng)網(wǎng)絡(luò)架構(gòu),旨在為任意給定的降維投影(如t-SNE或UMAP的結(jié)果)同時賦予參數(shù)化和可逆的能力。他們的研究成果發(fā)表在《Computers & Graphics》期刊上。
        研究人員開展這項研究,主要運用了三種核心的神經(jīng)網(wǎng)絡(luò)架構(gòu)與訓練策略。首先是作為基線的分離式投影器與重構(gòu)器,它由兩個獨立訓練的前饋神經(jīng)網(wǎng)絡(luò)組成,分別學習從高維到投影空間的正向映射以及反向映射。其次是自編碼器,它通過端到端訓練,其編碼器學習參數(shù)化投影,解碼器學習逆投影,并通過在損失函數(shù)中結(jié)合重構(gòu)誤差和投影對齊損失來約束潛在空間。第三是變分自編碼器,它在自編碼器的基礎(chǔ)上引入了概率化的潛在空間,使用KL散度進行正則化,并探索了基于采樣或基于均值兩種不同的投影對齊損失。研究在六個不同維度和復(fù)雜度的數(shù)據(jù)集上,以t-SNE和UMAP的投影結(jié)果為訓練目標,對這些方法進行了定量和定性評估。
        研究結(jié)果
        3.1. 分離式投影器與重構(gòu)器
        該架構(gòu)作為基線,展示了在沒有端到端優(yōu)化或潛在空間正則化的情況下,獨立網(wǎng)絡(luò)學習正向和逆向映射的能力。然而,這種方法對于分布外樣本的生成能力有限。
        3.2. 自編碼器
        通過端到端訓練和結(jié)合了重構(gòu)損失與投影對齊損失的聯(lián)合優(yōu)化,自編碼器能夠?qū)W習一個既支持參數(shù)化投影又支持逆投影的連貫?zāi)P汀3瑓?shù)ω控制著潛在空間與目標投影的對齊程度和重構(gòu)質(zhì)量之間的權(quán)衡。
        3.3. 變分自編碼器
        VAE通過其概率化潛在空間和KL散度正則化,旨在獲得更連續(xù)、平滑的潛在表示。研究比較了兩種變體:VAE-?使用從分布中采樣的潛在變量與目標投影計算對齊損失;VAE-μ則使用潛在分布的均值μ進行對齊。結(jié)果表明,KL正則化能有效促進潛在空間的平滑性。
        評估與討論
        系統(tǒng)的評估表明,所有提出的架構(gòu)都能夠有效地學習參數(shù)化和可逆的投影。在定量指標上,自編碼器和變分自編碼器在重構(gòu)質(zhì)量(如均方誤差MSE或二元交叉熵BCE)和投影保真度方面表現(xiàn)出色。特別是在處理分布外樣本時,基于自編碼器的架構(gòu)(尤其是使用KL散度正則化的VAE)展現(xiàn)出了比分離式P&R基線更優(yōu)的生成能力和泛化性。
        研究通過可視化工具進一步驗證了方法的有效性。梯度圖分析顯示,經(jīng)過正則化的自編碼器(如VAE)產(chǎn)生的逆投影映射更加平滑,局部梯度變化更緩,這有利于生成更連貫和合理的合成樣本。決策圖的生成與應(yīng)用則證明,這些可逆投影能夠可靠地用于可視化分類器的決策邊界,在分類器評估和反事實解釋等任務(wù)中具有實用價值。
        研究結(jié)論與重要意義
        本研究表明,通過精心設(shè)計的正則化方法,自編碼器神經(jīng)網(wǎng)絡(luò)能夠有效地學習與用戶指定投影對齊的潛在空間,從而同時實現(xiàn)高質(zhì)量的參數(shù)化投影和逆投影。在比較的三種架構(gòu)中,變分自編碼器,尤其是采用KL散度正則化的VAE-?變體,綜合表現(xiàn)最為突出。它不僅在標準重構(gòu)和投影任務(wù)上達到與基線相當或更優(yōu)的精度,更重要的是,其強正則化作用產(chǎn)生了高度連續(xù)和平滑的潛在空間。這使得該模型能夠從投影空間的任意位置(甚至是遠離訓練數(shù)據(jù)分布的區(qū)域)生成語義合理的高維數(shù)據(jù)樣本,顯著提升了模型的交互式生成和探索能力。
        這項工作的意義深遠。首先,它提升了降維方法的可解釋性和功能性,使靜態(tài)的可視化結(jié)果轉(zhuǎn)變?yōu)閯討B(tài)的、可交互的生成模型。用戶現(xiàn)在可以實時地將新數(shù)據(jù)點嵌入到現(xiàn)有投影中,也可以從投影圖中“逆向工程”出數(shù)據(jù)特征,或通過拖拽交互生成用于假設(shè)檢驗的反事實樣本。其次,該方法具有廣泛的適用性,其框架獨立于底層降維算法,可以適用于t-SNE、UMAP乃至其他任何自定義的二維投影。最后,研究提供的詳細評估、開源代碼及實踐建議,為后續(xù)研究者和實踐者提供了可復(fù)現(xiàn)的藍圖和實用的工具,有望推動交互式數(shù)據(jù)分析和可視化生成模型在生命科學、醫(yī)療健康、材料發(fā)現(xiàn)等多個領(lǐng)域的更深入應(yīng)用。通過將強大的神經(jīng)網(wǎng)絡(luò)與經(jīng)典的可視化需求相結(jié)合,這項工作為下一代智能數(shù)據(jù)分析工具的發(fā)展奠定了堅實的基礎(chǔ)。
        相關(guān)新聞
        生物通微信公眾號
        微信
        新浪微博

        知名企業(yè)招聘

        熱點排行

          今日動態(tài) | 人才市場 | 新技術(shù)專欄 | 中國科學人 | 云展臺 | BioHot | 云講堂直播 | 會展中心 | 特價專欄 | 技術(shù)快訊 | 免費試用

          版權(quán)所有 生物通

          Copyright© eBiotrade.com, All Rights Reserved

          聯(lián)系信箱:

          粵ICP備09063491號