麻省理工研製出能識別物體並即時生成地圖的機械人成像系統
2015-07-30
上面的 Gif 看起來是不是有種迷之既視感?答案就在下方:
沒錯,這簡直就是《終結者2》里 T-800 的視角嘛!
和 T-800 相似,麻省理工學院計算機科學與人工智能實驗室開發出了一套可以識別物體的系統,該系統使用一個普通的 RGB 攝像機(終結者式的血紅色暴力濾鏡自然就免了...),能夠精確地識別出物體。在未來,它或許能幫助機械人更好地與所處環境進行交互,也能更有效率地為人類導航。研究的首席作者 Sudeep Pillai 說:「理想的情況是,在未來某一天機械人能為我們洗盤子。我們需要通過這個系統讓機械人看到應該看見的東西,並且與其產生互動」。
這套系統整合了之前就存在的經典的識別系統以及「即時定位於地圖構建」(SLAM)系統,後者能讓諸如無人駕駛汽車一類的電子設備擁有一個即時的三維視角。MIT 團隊開發的 SLAM-aware 系統能從多個視角識別物體收集信息,並同時為眼前的環境繪製出地圖。系統從各不同的角度觀察物體的每個部分,隨後將收集到的信息與含有對物體描述的數據庫數據進行對比。舉個例子,SLAM-aware 看見一個椅子,它會從各個角度將椅子分解為座墊,四條腿和靠背,最後與數據庫進行匹配得出結論。
既然 SLAM-aware 系統能夠對即時生成環境三維地圖,那麼理所當然它也能更好地完成移動或取出物品的任務,該系統能大大減少機械人的出錯率。
傳統的圖像識別系統,被研究團隊稱之為「SLAM-obvious」,它們並不會生成三維地圖,也只能靠逐幀生成靜態圖像來識別物體。對比來看,SLAM-aware 系統在雜亂擁擠的環境中同時識別出多種物體的能力要強得多。
在一項測試中,SLAM-aware 識別物體的準確率達到了86.1%,這個數字已經可以與使用紅外線進行物體識別的系統進行同等級的比較。雖然後者精度高達92.8%,但時間成本較高。某些紅外識別系統需要運行4秒才能得出結論,而SLAM-aware 運行時間只有1.6秒。同時,紅外線系統在戶外工作時,由於光照環境不同,難度會很大。
在未來,團隊將會繼續改進此系統,同時將努力解決一個叫「環路閉合」的經典機械人難題。當機械人無法辨別出自己之前曾經來過的地理位置,並無法進行導航和與環境交互時,環路閉合就會發生。
研究論文猛擊我
popsci