中文字幕精品久久久久人妻红杏1,亚洲制服丝袜在线观看,91啪啪视频

首頁今日動態人才市場新技術專欄中國科學人云展臺
BioHot
云講堂直播會展中心特價專欄技術快訊免費試用

生物通官微
陪你抓住生命科技
跳動的脈搏

生物通首頁 > 今日動態 > 正文

NEGS-Avatar：基于單目視頻的2D虛擬形象的常規嵌入式高斯模型

《Computers & Graphics》：NEGS-Avatar: Normal Embedded Gaussians for 2D avatar from monocular video

【字體：大中小】 時間：2026年03月02日 來源：Computers & Graphics 2.8

編輯推薦：

　　從單目RGB視頻中構建高保真可動畫化的人體模型是計算機視覺與圖形學領域的長期挑戰。現有隱式NeRF方法缺乏顯式幾何信息表征，而3D Gaussian Splatting（3DGS）雖能提供高效點云表示，仍存在法線信息缺失導致幾何細節不足的問題。本文提出NEGS-Avatar方法，通過將表面法線作為可學習的3D高斯屬性嵌入傳統3DGS框架，結合局部自適應密度控制策略和分離式鏡面/漫反射顏色預測模塊，顯著提升服裝表面褶皺等細節的建模精度與渲染質量。實驗表明該方法在合成新視角圖像和動畫驅動方面達到SOTA水平，并開源代碼。

Zedan Zheng|Yudi Tan|Zhuo Su|Fan Zhou|Baoquan Zhao

中山大學數字生活國家工程研究中心計算機科學與工程學院，中國廣東省廣州市510006

摘要

從單目RGB視頻創建逼真的人體頭像一直是一個長期存在且具有挑戰性的問題。現有的基于NeRF的方法在特征表示中通常缺乏顯式的幾何信息。盡管3D高斯散布（3DGS）作為一種基于點云的顯式替代方法最近出現，但這種非結構化表示中仍然缺少關于法線信息等幾何細節的信息。在本文中，我們提出了NEGS-Avatar，這是一種利用3DGS從單目視頻建模可動畫2D人體頭像的新方法。我們的方法將法線信息作為可學習的屬性納入3D高斯中，以構建定向的3DGS來改進身體外觀建模。法線信息以及其他屬性（如位置、旋轉和比例）是根據給定的身體姿勢預測的，以模擬與姿勢相關的非剛性變形。然后使用線性混合皮膚技術將高斯轉換為演員姿勢空間，以實現姿勢動畫。此外，我們開發了一種基于局部性的自適應密度控制策略，該策略利用局部區域的法線方差來促進有效的高斯密度化。最后但同樣重要的是，我們提出將鏡面反射和漫反射成分分開進行顏色預測，從而形成一個更準確、可解釋且可控的外觀預測模型。實驗結果表明，NEGS-Avatar在質量和數量上都達到了最先進的性能，尤其是在服裝表面的細節方面。代碼可在https://github.com/Zheng-ZD/NEGS-Avatar.git獲得。

引言

從單目視頻或圖像序列創建逼真且高保真度的人體頭像一直是計算機視覺和圖形學中的熱門課題，因為它有多種應用，例如VR/AR、電影制作和電子商務[1]。然而，有效地建模和重建高質量的人體頭像仍然具有挑戰性。

傳統方法通常依賴于顯式表示（如網格和點云）來重建3D人體[2]、[3]、[4]、[5]、[6]，并使用線性混合皮膚（LBS）[7]直接驅動它們。然而，這些方法不是端到端的流程，用于新視圖和姿勢合成，因為只有幾何信息而沒有圖像信息作為監督，從而降低了渲染性能[8]、[9]。自2020年以來，神經輻射場（NeRF）[10]已成為一種流行的方法，用于通過連續表示對新視圖進行3D場景建模。后來，它被應用于數字人體重建和動畫任務[11]、[12]。然而，基于NeRF的方法通常需要較長的訓練和渲染時間，因為多層感知器（MLP）的計算成本很高。盡管已經提出了顯式特征編碼架構（如多分辨率哈希[13]），但在不犧牲渲染質量的情況下將這些方法應用于實時應用仍然很困難，因為哈希碼的信息密度不如MLP。

最近，3D高斯散布（3DGS）[14]的出現由于其快速的訓練和推理能力以及保持高渲染質量而受到了廣泛關注。最新的工作嘗試將人體頭像建模為3D高斯的集合[15]、[16]、[17]，用于動畫和渲染。盡管這些方法已經達到了最先進的性能，但它們仍然難以捕捉和表示服裝上的細微幾何細節，如皺紋。最新的工作探索了在網格[18]和法線[19]上表示3DGS，以豐富細粒度幾何信息，但人體先驗和正則化尚未得到充分利用。

為了解決上述挑戰并克服現有方法的局限性，我們提出了NEGS-Avatar，這是一種基于3DGS的新方法，可以使用單目RGB視頻作為輸入，高效生成新視圖中的逼真人體圖像，如圖1所示。大多數相關工作都集中在預測存儲在普通3DGS中的位置和協方差矩陣屬性上，忽略了3D高斯作為另一種點云也可以配備方向并分配法線屬性來指示穿著人體的幾何細節。IHuman[19]使用人體表面法線導出來輔助監督，但未能充分連接高斯和表面法線，并且對不同的人體姿勢和相機視圖缺乏魯棒性。據我們所知，還沒有嘗試將表面法線作為顯式屬性整合到3D高斯中，以提高從單目視頻學習頭像的質量，特別是在細化渲染細節方面。另一方面，表面法線可以用于在傳統渲染管線中實現各向異性的鏡面反射照明，從而有助于分離環境中的鏡面反射和漫反射照明，提高渲染精度。因此，3D高斯的顯式特性以及表面法線在傳統計算機圖形學中表示細節的效率激發了我們將法線整合到高斯中的想法，以改進之前的訓練流程并實現高保真渲染。

雖然從協方差矩陣表示的橢球體最短半徑導出3D高斯的表面法線是可行的，但這種近似的不可忽略的不準確性會導致較差的渲染結果。為了克服這一挑戰，我們引入了表面法線作為新的屬性，類似于位置和協方差。對于由衣物引起的非剛性變形，我們從規范空間中的3D高斯開始（特征空間定義了執行靜態T姿勢的人體演員）。然后我們預測這些屬性的非剛性偏移，以模擬衣物相對于基礎身體的位移。然后對這些屬性應用剛性的LBS變形，將它們從規范空間轉換為姿勢空間。為了更好地預測3D高斯的法線，我們的方法使用偽真實值（不是手動標記而是由程序自動生成的法線圖）作為監督來訓練一個小MLP，確保高斯法線的優化更加可控。

除了捕捉更多幾何細節外，表面法線信息還可以進一步用于指導其他高斯屬性的優化。具體來說，由于局部法線的統計信息反映了相應幾何的復雜性，它可以用來指導高斯的密度化過程（第3.1節）。為此，我們引入了一種基于局部性的自適應密度控制策略，通過考慮最近高斯中存儲的法線方差來有效測量某個3D高斯與其鄰居之間的相似性。此外，我們還利用法線來預測穿著人體的動態顏色。為此，我們將顏色分解為兩個組成部分，即鏡面反射和漫反射，并使它們依賴于估計的高斯法線屬性，這有助于捕捉具有不同粒度細節的人體頭像信息。

我們的貢獻總結如下：

(1)我們提出了NEGS-Avatar，這是一種將表面法線嵌入到傳統3DGS流程和從單目視頻學習頭像的新方法，以實現新視圖和姿勢下的高保真人體渲染。法線由帶有偽真實值監督的神經網絡估計，確保了準確性和靈活性。

(2)我們提出了一種基于局部性的自適應密度控制策略，該策略利用高斯法線方差來指導模型控制3D高斯的數量，同時考慮了高斯法線屬性的分布信息。

(3)我們設計了一個與高斯法線集成的分解顏色預測模塊，用于模擬人體頭像在照明和陰影中的詳細外觀。

方法

我們的目標是從單目視頻中學習真實且可動畫的人體頭像，以實現自由視點渲染。我們在圖2中展示了我們的流程。我們首先在第3.1節簡要回顧了3D高斯散布[14]，然后在第3.2節介紹了NEGS-Avatar的變形和轉換模塊，在第3.3節介紹了法線估計方法，在第3.4節介紹了顏色估計方法，在第3.5節介紹了新穎的基于局部性的自適應密度控制策略以及詳細信息

實驗

在本節中，我們將詳細闡述訓練細節并展示實驗結果，以驗證所提出方法的有效性。

結論

我們介紹了NEGS-Avatar，這是一個基于3DGS的新框架，用于從單目視頻創建逼真的人體頭像，并在新視圖和新姿勢下合成高質量圖像。我們首先在3D高斯中添加了表面法線作為新的屬性，然后通過兩個獨立的模塊學習服裝變形和姿勢轉換。為了模擬具有精細細節的頭像外觀，我們將顏色分解為鏡面反射和漫反射顏色，兩者都嵌入了法線。在優化過程中，

CRediT作者貢獻聲明

Zedan Zheng：寫作 – 審稿與編輯，撰寫 – 原稿，可視化，方法論，概念化。Yudi Tan：寫作 – 審稿與編輯，撰寫 – 原稿，方法論。Zhuo Su：寫作 – 審稿與編輯。Fan Zhou：寫作 – 審稿與編輯。Baoquan Zhao：寫作 – 審稿與編輯。

利益沖突聲明

作者聲明他們沒有已知的財務利益或個人關系可能影響本文報告的工作。

致謝

本研究得到了深圳市科技創新計劃（SYSPG20241211173951079）的支持。

熱點排行

新聞專題

聯系信箱：

粵ICP備09063491號