精確的物體姿態估計是指機器人同時確定物體的位置和方向的能力。這對機器人技術十分重要,尤其是在對制造和物流等行業非常關鍵的拾取和放置任務中。隨著機器人承擔的復雜操作任務越來越多,它們日益需要具有精確確定物體、位置和方向的六個自由度(6D姿態)的能力,以確保能夠以可靠和安全的方式與物體進行交互。盡管深度學習取得了進步,但6D姿態估計算法的性能在很大程度上取決于其訓練數據的質量。
(圖片來源:芝浦工業大學)
據外媒報道,在由日本芝浦工業大學(Shibaura Institute of Technology)副教授Phan Xuan Tan領導一項新研究中,研究人員引入精心設計的數據集,旨在提高6D姿態估計算法的性能。該數據集通過提供全面的資源,允許機器人在現實環境中以更高的精度和適應性來執行任務,從而彌補機器人抓取和自動化研究中的主要空白。該團隊還包括來自河內工業大學(Hanoi University of Industry)和河內理工大學(Hanoi University of Science and Technology)的研究人員。
芝浦工業大學副教授Phan Xuan Tan表示:“研究人員的目標是創建一個數據集,不僅可以推進研究,而且可以解決工業機器人自動化方面的實際挑戰。我們希望它能為研究人員和工程師提供寶貴的資源。”
該團隊創建的數據集不僅可以滿足研究社區的需求,而且適用于實際的工業環境。使用Intel RealSense depth D435攝像頭,它們可以收集優質RGB和深度圖像,并通過物體6D姿態數據旋轉和平移分別進行注釋。該數據集具有各種形狀和大小的特征,并添加了數據增強技術以確保其在不同環境條件下的多功能性。這種方法使該數據集高度適用于廣泛的機器人應用。
Tan副教授表示:“該數據集經過精心設計,適合各個行業。它包含具有不同形狀和環境變量的物體,不僅為研究人員提供了寶貴的資源,也使相關領域(機器人需要在動態和復雜條件下運行)工程師受益。”
通過最先進的深度學習模型EfficientPose和FFB6D進行評估,該數據集分別達到了97.05%和98.09%的準確率。這證明它可以提供可靠和精確的姿態信息,對于機器人操作、制造業質量控制和自動駕駛汽車等應用十分重要。這些算法在數據集上的強大性能,突顯了對需要精確度的機器人系統進行改進的潛力。
Tan副教授表示:“該數據集包括一系列基本形狀,包括長方體、梯形和圓柱體。對其進行擴展以包含更復雜和不規則的物體,將使其更適用于現實世界的場景。Intel RealSense Depth D435攝像頭可以提供出色的深度和RGB數據,但該數據集對它具有依賴性,無法使用相同設備的研究人員可能訪問受限。”
盡管存在這些挑戰,但研究人員對該數據集的效用持樂觀態度。結果表明,良好的數據集設計可以明顯提高6D姿態估計算法的性能,從而支持機器人以更高的精確度和效率執行更復雜的任務。展望未來,通過整合更廣泛的物體和自動化部分數據收集過程,該團隊計劃擴展數據集,以使其更高效和易于訪問。他們希望進一步增強該數據集的適用性和實用性,使依賴于機器人自動化的研究人員和行業受益。