日日干夜夜撸,中文字幕亚洲天堂,3p视频在线观看

首頁今日動態人才市場新技術專欄中國科學人云展臺
BioHot
云講堂直播會展中心特價專欄技術快訊免費試用

生物通官微
陪你抓住生命科技
跳動的脈搏

生物通首頁 > 今日動態 > 正文

面向復雜農業場景的球狀作物三維感知：基于立體視覺與先驗增強語義形狀建模的PES-3D檢測器

《Smart Agricultural Technology》：PES-3D: A Stereo Vision-Based 3D Spherical Crop Detector with Prior-Enhanced Semantic Shape Modelling

【字體：大中小】 時間：2026年02月27日 來源：Smart Agricultural Technology 5.7

編輯推薦：

　　本研究針對自動化農業采收與分選中球狀作物（如柚子、西瓜）面臨的遮擋、枝葉密集和視覺雜亂等挑戰，提出了PES-3D（先驗增強立體三維檢測器）。該框架創新性地融合立體視覺、類別特異性形狀先驗和優化的二維特征提取骨干網絡，實現了圖像與點云表征間的有效跨模態對齊，并在復雜田間條件下顯著提升了空間定位的準確性與穩定性。在農場規模數據集上的實驗表明，PES-3D在IoU=0.5時mAR/mAP達到83.33%/67.36%，性能優于FCAF3D、FF3D等基線方法。該研究為機器人精準定位與抓取規劃提供了更準確的作物輪廓感知，有望支持更穩定的操作并降低機械損傷。

在智慧農業蓬勃發展的今天，自動化采收與產后處理已成為提升效率、降低損失的關鍵。想象一下，一臺機器人正在果園或田間地頭工作，它的“眼睛”需要精準地找到那些隱藏在繁茂枝葉下、或散落在復雜地面上的球形果實——比如油茶果、油棕果、橄欖，或者我們更熟悉的柚子、西瓜。然而，現實環境充滿了挑戰：果實相互遮擋、背景雜亂無章、光照變化無常。傳統的單目視覺方法難以感知深度，容易出錯；而激光雷達等主動深度傳感設備雖然精確，但成本高昂且對環境敏感，難以大規模部署。如何在保證成本效益的同時，實現復雜田間環境下對球形作物穩定、精確的三維定位，成為了推動農業機器人實用化必須跨越的一道坎。

為此，中國農業大學信息與電氣工程學院的Jingyi Jia、Hong Sun等研究人員在《Smart Agricultural Technology》上發表了一項研究，提出了一種名為PES-3D（Prior-Enhanced Stereo 3D Detector）的創新框架。這項研究旨在利用經濟高效的立體視覺硬件，結合對球形作物幾何特性的先驗知識，構建一個能夠在真實農業環境中可靠工作的實例級三維感知系統。研究團隊通過精心設計的數據采集、跨模態的特征融合以及新穎的損失函數，最終證明了PES-3D在應對遮擋、雜亂背景等挑戰時的卓越性能，不僅在其自建的農場規模數據集上超越了現有先進方法，在著名的KITTI自動駕駛基準測試中也展現了強大的跨領域泛化能力。這項成果為農業機器人的精準“眼手協調”提供了強有力的技術支撐，朝著更智能、更高效的自動化農業生產邁出了堅實一步。

為了達成上述目標，研究者們主要運用了以下幾個關鍵技術方法：首先，使用Luxonis OAK-D立體相機在真實農田和模擬產后場景下采集了柚子和西瓜的立體圖像對，并進行了精細的二維（使用LabelMe）和三維（使用LabelCloud）手工標注，構建了專門的任務導向數據集。其次，設計了一個三階段的PES-3D算法流水線：（1）圖像分支：采用基于Visual Attention Network (VAN)的編碼器-解碼器架構進行2D實例分割，獲取物體的邊界框和語義掩碼；（2）點云分支：利用RAFT-Stereo網絡進行實例級的視差估計，進而通過立體幾何反投影生成偽點云；（3）三維檢測與先驗增強：在經典的PointRCNN檢測框架中，用RFAConv模塊增強局部幾何感知，并引入了兩種先驗——基于CAD模型的數據級結構增強先驗和旨在強制幾何一致性的球形一致性損失（Spherical Consistency Loss， SCL）。該損失函數包含幾何精度、尺度一致性和形狀匹配（基于倒角距離）三個組成部分，引導網絡預測更符合球體幾何特性的邊界框。

研究結果

•
2. 研究方法論
- •
  2.3. 圖像分支：研究者設計了基于VAN骨干網絡的2D目標檢測與實例分割模塊。實驗表明，該圖像分支在平均準確率（mAcc）和平均交并比（mIoU）上均優于對比的Mask R-CNN和YOLO-v11模型（如mAcc達到96.30%），為后續三維流程提供了高質量的語義和區域建議。
- •
  2.4. 點云分支
  - •
    2.4.2. 3D檢測器：研究將PointRCNN中的Set Abstraction模塊替換為RFAConv，以增強對局部點云結構的感知能力。同時，引入了基于柚子CAD模型的點云結構增強策略，通過在訓練中合成多尺度、多密度的球形點云樣本來豐富數據的幾何多樣性。
  - •
    2.4.3. 球形一致性損失（SCL）：新提出的SCL損失函數從幾何精度、尺度一致性和形狀匹配三個維度約束預測結果。消融實驗證明，SCL的引入顯著提升了檢測性能，特別是在處理遮擋和點云不完整的情況時。
•
3. 結果與討論
- •
  3.1.1. 自定義數據集上的實驗結果：在自建的柚子數據集上，PES-3D在IoU=0.5時取得了83.33%的mAR和67.36%的mAP，在IoU=0.7時取得了62.50%的mAR和38.01%的mAP，均優于PointPillar、ImVoteNet、FCAF3D和FF3D等主流三維檢測方法。可視化結果顯示了其在2D檢測、圖像投影3D框和點云3D定位方面的有效性。在未參與訓練的西瓜田間數據集上，PES-3D也展現了良好的泛化能力和結構感知效果。此外，按遮擋程度分層的評估顯示，即使在重度遮擋（>50%）下，該方法仍能保持52.40%的mAP（IoU=0.5），證明了其魯棒性。
- •
  3.1.2. KITTI數據集上的實驗結果：在跨領域的KITTI基準測試中，PES-3D同樣表現出色。在中等難度設定和IoU=0.7的標準下，其三維檢測精度（AP_3D）達到77.45%，大幅超過S-RCNN、Disp R-CNN和ZoomNet等方法，證明了該框架強大的通用性和在處理復雜場景（如遮擋、小目標）方面的優勢。
- •
  3.2. 消融實驗：系統性的消融研究分別評估了圖像分支的VAN骨干網絡、點云分支的RFAConv模塊、CAD模型先驗增強以及球形一致性損失（SCL）各組成部分的貢獻。結果表明，每個模塊都對最終性能有正向提升，其中SCL的引入帶來了最顯著的性能增益，尤其是在提升邊界框的幾何一致性方面作用關鍵。

結論與意義

本研究成功開發并驗證了PES-3D，一個面向實際農業生產環境的、基于立體視覺的球形作物三維感知框架。其核心貢獻在于將成本效益高的立體視覺硬件與類別特定的形狀先驗知識相結合，通過創新的跨模態對齊和幾何約束損失函數，有效解決了在遮擋、雜亂背景下進行精確三維定位的難題。

實驗結果表明，PES-3D不僅在專門的自定義農業數據集上取得了領先的性能，還在通用的KITTI自動駕駛數據集上展現了卓越的跨領域泛化能力。這標志著該方法不僅適用于特定的球形作物檢測任務，其核心思想——即利用幾何先驗增強基于視覺的三維感知——對于其他具有規則幾何形狀的農業目標（如圓柱形果實、方形包裝盒）乃至更廣泛的機器人感知場景都具有重要的借鑒意義。

該研究的現實意義尤為突出。通過提供更準確、更穩定的作物輪廓三維感知，PES-3D能夠直接服務于農業機器人的定位和抓取規劃系統。這意味著未來的采收機器人可以更可靠地識別并定位果實，即使是那些部分被樹葉遮擋或散落在不平整地面上的目標，從而有望實現更穩定的機械操作，減少采收和分選過程中的物理損傷，提升整體作業效率和質量。盡管全面的系統級驗證仍在進行中，但此項工作無疑為推動智能農業從實驗室走向田間地頭提供了關鍵的技術基石。

熱點排行

新聞專題

聯系信箱：

粵ICP備09063491號