資料來源:光州科學與技術學院
韓國光州科技學院(GIST)的一個研究小組創造了一種方法,使人工智能(AI)視覺系統能夠更好地識別那些雜亂無章地放在一起、可能不完全可見的物體。
GIST的副教授Kyoobin Lee和博士生Seunghyeok Back以及他們在該大學的研究團隊,著手創建一個能夠識別和分類雜亂場景中物體的人工智能系統。該團隊很快發現,機器人視覺系統需要大量的物體數據集,以便能夠識別不完全可見的物體。
Back說:"我們期望機器人能夠識別和操縱它們以前沒有遇到過的或被訓練過的物體,然而,在現實中,我們需要一個一個地手動收集和標記數據,因為深度神經網絡的泛化能力高度依賴于訓練數據集的質量和數量。"
通常情況下,當人工智能遇到一個由許多雜亂的物體組成的場景時,系統會嘗試僅根據其可見的部分來識別每個項目。Lee和Back決定采取不同的方法,而是教人工智能識別每個物體的幾何形狀,這樣它就能推斷出它看不到的物體的哪些部分。
教會人工智能這樣做需要一個更小的數據集,即包含深度信息的45,000張照片的現實合成圖像。當人工智能看到一個場景時,它開始通過挑選出感興趣的物體來理解它,然后將該物體分割成一個 "可見掩碼 "和一個 "調和掩碼"。
比較現有的方法和研究者識別部分被遮擋物體的方法。|來源:光州科技學院
在對場景進行分割后,人工智能使用了一個分層遮擋建模(HOM)方案。該方案將可能被遮擋的特征組合按其可能存在的程度進行排序。該團隊針對三個基準測試了其HOM方案,發現它達到了最先進的性能。
Back說:"以前的方法只限于檢測特定類型的物體,或者只檢測可見區域而不明確推理被遮擋的區域。相比之下,我們的方法可以像人類視覺系統一樣推斷出被遮擋物體的隱藏區域。這能夠減少數據收集工作,同時提高復雜環境下的性能。"
該研究小組的成果在2022年IEEE國際機器人和自動化會議上被接受。
2025-04-08 08:51
2025-04-07 12:08
2025-04-07 12:07
2025-04-07 12:06
2025-04-07 09:52
2025-04-07 09:49
2025-04-07 09:43
2025-04-03 09:11
2025-04-03 08:56
2025-04-03 08:51