會像人一樣學習新技能的機械人
2015-05-26
機械人最出名的弱點就是不會通過反覆練習學習做一件事。你能在一個機械人的大腦里打包許多信息,但是卻沒辦法教它完成沒有事先編程好的任務。甚至連簡單的搬磚和扭飲料瓶都做不到。
不過這種情況很快就會改變了,加州大學伯克利分校的研究員們正在研究一種新算法讓機械人可以通過練習、犯錯來學習所有新技能,就像人類一樣。切實點說,這個算法可能最終可能產生機械人管家,能幫你完成各種不想做的無聊乏味的家務活(換燈泡、洗廁所、疊衣服)。
一般來說,機械人認識世界是全靠大量預編程序的,讓它們知道在什麼情況下作何反應。這種算法可用於可控制的環境里(如實驗室或醫療機構),如果它們要更加融入我們的日常生活,機械人必須要學會適應未知環境,這會是人工智能技術發展的關鍵一步。
為此,伯克利分校「人與機械人倡議」活動的參與研究員正轉向稱為「深度學習」的人工智能分支,這個技術是來源於大腦利用神經線路來感知世界並進行互動。
機械人研究者Sergey Levine介紹說:「人類並不是生來就會所有的行為模式,但我們也不需要被編程。我們用一生的時間從他人、實踐中學習、掌握這些技能。這個學習的過程根植於我們的神經系統,我們甚至沒辦法言傳身教到底要怎樣才能做好這件事,只能提供一些建議和指導讓他們自己領悟學習。」
如果你用過Siri、谷歌的語音助手或是谷歌街景,那你就已經從(深度學習)中獲益了。不過把深度學習應用到動作技能上卻有更多挑戰。從複雜程度來說, 肢體任務比單純地用視覺或聽覺被動感知要難得多。
在近期的實驗中,研究員一直在研究一個他們叫「伯克利清理乏味任務機械人」(Berkeley Robot for the Elimination of Tedious Tasks,BRETT)的小機械人,BRETT被訓練完成了一系列簡單的動作任務,比如把楔子釘進洞里或堆樂高磚。這個算法包括BRETT學習新人物的好壞,達到多熟練會有獎勵機制。這個獎勵制度很關鍵:能幫助他完成任務的會得更高的分,而沒用得動作則不會得分,這樣會讓他的神經網絡傳達成千上萬的參數。
到目前為止,BRETT的訓練結果令人震驚。如果把物體在一個場所的位置告訴他,他一般能在十分鐘裡面完成一個新任務。如果位置未知,那他就要同時開動視覺和動作控制馬達,那麼這個學習過程需要幾個小時。
伯克利分校電氣工程與計算機科學系的Pieter Abbeel說:「在我們的機械人學習打掃房間或洗衣服之前,我們仍然有很長的路要走,不過我們目前出的初步結果表明這種深度學習技術可以讓機械人從零開始學習複雜的任務,這將帶來革命性的影響。在接下來的額五到十年裡,它們的學習能力或許會有明顯進步。」
想想過年時候的大掃除全都可以交給機械人,是不是很爽?
gizmodo