夊夊夊夂夂夂夂夂夂夂亚洲亚洲亚洲亚洲色色色 ,亚洲91页,无码中文人妻

首頁今日動態人才市場新技術專欄中國科學人云展臺
BioHot
云講堂直播會展中心特價專欄技術快訊免費試用

生物通官微
陪你抓住生命科技
跳動的脈搏

生物通首頁 > 今日動態 > 正文

ProtoSeg：一種基于原型的點云實例分割方法

《Signal Processing: Image Communication》：ProtoSeg: A prototype-based point cloud instance segmentation method

【字體：大中小】 時間：2026年02月27日 來源：Signal Processing: Image Communication 3.4

編輯推薦：

　　3D點云實例分割研究提出聚類-free方法，通過Dilated Point Inception模塊聯合學習系數和原型，利用非極大值抑制替代傳統聚類，實現28%加速且穩定性顯著提升，在S3DIS和PartNet數據集上mRec和mAP分別優于基線4.9%和2.0%。

作者：Remco Royen、Leon Denis、Adrian Munteanu

所屬機構：布魯塞爾自由大學電子與信息學系，比利時布魯塞爾1050

摘要

3D實例分割對于理解點云場景至關重要。本文提出了一種新穎的神經網絡架構，用于對3D點云進行實例分割。我們提出同時并行學習系數和原型，然后將它們組合起來得到實例預測結果。系數是通過使用一組過完備的采樣點，并結合一種稱為“膨脹點插入（Dilated Point Inception）”的新多尺度模塊計算得出的。由于得到的實例掩碼預測結果是過完備的，我們采用了非最大值抑制算法來獲取最終預測。這種方法省去了耗時的聚類步驟，從而提高了推理的穩定性。與現有技術相比，該方法的速度提高了28%，并且標準差最低。實驗表明，我們的方法推理時間的標準差僅為總時間的1.0%，而現有方法的標準差在10.8%到53.1%之間。此外，我們的方法在S3DIS-blocks（mRec測試中提高了4.9%）和PartNet（mAP測試中平均提高了2.0%）上的表現也優于現有技術。

引言

3D技術領域因經濟型3D傳感器的普及和深度學習的興起而吸引了大量學術界和工業界的關注。3D場景理解在許多應用領域中都具有重要意義，例如虛擬現實[1]、自動駕駛[2][3]、無人機探索[4]和機器人技術[5]。其中，3D實例分割是一個基礎但具有挑戰性的子領域。雖然語義分割僅嘗試為每個點分配一個語義標簽[6][7][8]，但實例分割需要更高級的場景理解能力，以便區分屬于同一語義類別的對象。

2D實例分割在文獻中已經得到了充分研究[9][10][11][12][13][14][15][16][17][18][19][20][21]。然而，點云實例分割由于點云的非結構化特性、實例大小和輸入坐標尺度的大變化以及可能的輸入點數量眾多而面臨額外的挑戰。

現有的最先進方法[22][23][24][25]采用自下而上的方法，首先計算判別特征、語義標簽和中心偏移向量，然后使用聚類算法篩選出實例候選對象并保留最佳結果。盡管這些方法表現良好，但由于聚類步驟耗時較長，推理速度相對較慢。此外，所需的推理時間變化較大，因為聚類和候選對象選擇過程受到場景的強烈影響，這限制了它們的在線應用。

為了解決這些問題，本文提出了一種無需聚類的新方法，該方法同時學習原型和系數。通過將兩者線性組合，可以使用簡單快速的非最大值抑制（NMS）算法篩選出最佳的實例掩碼候選對象。雖然我們的方法在技術上屬于基于提議的方法，但與傳統方法不同，我們不需要精確的提議預測，而是通過最近點采樣（FPS）來采樣點子集。這樣可以避免誤差累積和耗時的提議預測過程。新穎的膨脹點插入（DPI）模塊可以為每個提議獲取多尺度系數。值得注意的是，提議集是過完備的且數量固定。這種方法使得推理時間對底層場景的依賴性降低，因此更加可預測。我們在室內場景和物體部分上的實驗表明，測試集上的推理時間標準差僅為總時間的1.0%，而現有方法的標準差在10.8%到53.1%之間。此外，我們的方法在S3DIS-blocks（mRec測試中提高了4.9%）和PartNet（mAP測試中平均提高了2.0%）上的表現也優于現有技術。圖1中的箱形圖可視化了與現有方法的性能和速度對比。

總結來說，我們的主要貢獻如下：

我們提出了一種新穎的端到端基于原型的3D實例分割網絡架構。系數和原型并行學習并結合在一起得到實例預測結果。為此專門設計了一種互易損失函數。
一種名為“膨脹點插入（DPI）”的新模塊，可實現多尺度系數提取并提升性能。
所提出的方法在S3DIS-blocks和PartNet上的表現顯著優于現有技術。此外，我們的無聚類方法不僅實現了最快的推理速度，還降低了推理時間的變化幅度。

點云上的深度學習

PointNet[26]是該領域的開創性工作，它是第一個能夠直接處理點云的深度學習網絡。為了應對點云的非結構化特性，PointNet采用了排列不變的運算符。在PointNet++[27]中，這些想法被應用于局部組而不是整個點云。DGCNN[28]和PointWeb[29]首先構建圖結構，然后再應用圖網絡技術。

提出方法概述

所提出方法的架構如圖2所示，包括4個主要部分。首先，輸入數據

X \in R^{N I}

（其中

N

表示輸入點的數量，

I

表示通道數），通過特征提取器處理這些數據以獲得每個點的特征

F \in R^{N F}

（其中

F

表示特征維度）。這些特征作為輸入，進入兩個并行分支來計算系數和原型。前者是通過采樣

K

個點（詳見第3.2節）得到的。

實驗

為了驗證ProtoSeg的性能，我們在兩個廣泛使用的參考數據集S3DIS[49]和PartNet[50]上進行了定量和定性實驗。在這兩個數據集上，我們的方法都達到了最先進的性能水平。

結論

本文提出了一種用于3D實例分割的新型深度神經網絡。該架構生成原型并同時學習與之相關的系數，通過線性組合這些系數得到實例掩碼。接下來，使用非最大值抑制算法得到最終預測結果。為了使用一組過完備的確定性采樣點獲取多尺度系數，我們引入了膨脹點插入模塊。

CRediT作者貢獻聲明

Remco Royen：概念構思、資金獲取、研究設計、方法論、軟件開發、驗證、可視化、初稿撰寫、審稿與編輯。

Leon Denis：研究設計、監督、驗證、可視化、初稿撰寫、審稿與編輯。 Adrian Munteanu：概念構思、資金獲取、項目管理、監督、初稿撰寫、審稿與編輯。

利益沖突聲明

作者聲明他們沒有已知的可能會影響本文工作的財務利益或個人關系。

致謝

第一作者是FWO-SB博士研究員，由佛蘭德斯研究基金會（FWO）資助，項目編號為1S89420N。本工作還得到了佛蘭德斯研究基金會（FWO）在研究項目G094122N下的支持。

熱點排行

新聞專題

聯系信箱：

粵ICP備09063491號

摘要

引言

相關工作