機(jī)器人專家學(xué)會(huì)教嬰兒機(jī)器人
嬰兒通過探索他們的身體如何在太空中運(yùn)動(dòng),抓住玩具,將物品推下桌子以及觀察和模仿成年人的行為來了解世界。但是,當(dāng)機(jī)器人專家要教機(jī)器人如何完成任務(wù)時(shí),他們通常要么編寫代碼,要么物理地移動(dòng)機(jī)器人的手臂或身體以展示如何執(zhí)行動(dòng)作。
現(xiàn)在,華盛頓大學(xué)發(fā)展心理學(xué)家與計(jì)算機(jī)科學(xué)家之間的合作表明,機(jī)器人可以像孩子一樣“學(xué)習(xí)” —通過探索收集數(shù)據(jù),觀察人類做某事并確定如何自行執(zhí)行任務(wù)。
威斯康星大學(xué)計(jì)算機(jī)科學(xué)與工程學(xué)教授拉杰什·拉奧(Rajesh Rao)說:“您可以將此視為構(gòu)建可以像嬰兒向人類學(xué)習(xí)的方式向人類學(xué)習(xí)的機(jī)器人的第一步。”
“如果您希望對(duì)計(jì)算機(jī)編程一無(wú)所知的人能夠教機(jī)器人,那可以通過演示來實(shí)現(xiàn)–演示機(jī)器人如何清潔餐具,折疊衣服或做家務(wù)。但是要實(shí)現(xiàn)該目標(biāo),您需要機(jī)器人能夠理解這些動(dòng)作并自行執(zhí)行。”
這項(xiàng)研究從華盛頓大學(xué)研究所的學(xué)習(xí)和大腦科學(xué)實(shí)驗(yàn)室(I-LABS)結(jié)合兒童發(fā)展研究與機(jī)器學(xué)習(xí)方法,發(fā)表在一 紙十一月在雜志PLOS ONE。
在該論文中,威斯康星大學(xué)的團(tuán)隊(duì)開發(fā)了一種新的概率模型,旨在解決機(jī)器人技術(shù)的一個(gè)基本挑戰(zhàn):構(gòu)建可以通過觀察和模仿他人來學(xué)習(xí)新技能的機(jī)器人。
機(jī)器人學(xué)家與西澳大學(xué)心理學(xué)教授和I-LABS聯(lián)合導(dǎo)演安德魯·梅爾佐夫(Andrew Meltzoff)合作,他們的開創(chuàng)性研究表明,年齡在18個(gè)月以下的兒童可以推斷出成年人的行為目標(biāo),并自行開發(fā)出實(shí)現(xiàn)該目標(biāo)的替代方法。
在一個(gè)示例中,嬰兒看到一個(gè)成年人試圖將杠鈴形玩具拉開,但該成年人未能實(shí)現(xiàn)該目標(biāo),因?yàn)樵撏婢弑徽吃谝黄鸩⑶宜氖謴膬啥嘶洹雰鹤屑?xì)地注視著,然后決定使用其他方法-他們將小手指一直纏繞在末端,特別用力地猛拉-重復(fù)了成年人的意圖。
兒童會(huì)通過自我探索來獲得意圖閱讀技能,這可以幫助他們學(xué)習(xí)物理定律以及自己的行為如何影響物體,最終使他們能夠積累足夠的知識(shí),可以向他人學(xué)習(xí)并解釋自己的意圖。梅爾佐夫(Meltzoff)認(rèn)為,嬰兒學(xué)得如此之快的原因之一是他們?nèi)绱祟B皮。
“嬰兒從事著看似漫不經(jīng)心的游戲,但這使將來的學(xué)習(xí)成為可能。這是嬰兒創(chuàng)新的秘訣。”梅爾佐夫說。“如果他們?cè)噲D弄清楚如何使用新玩具,那么他們實(shí)際上是在利用與其他玩具一起玩耍獲得的知識(shí)。在游戲過程中,他們正在學(xué)習(xí)一種心理模型,以了解其行為如何導(dǎo)致世界發(fā)生變化。一旦有了該模型,就可以開始解決新穎的問題,并開始預(yù)測(cè)別人的意圖。”
Rao的團(tuán)隊(duì)利用嬰兒研究來開發(fā)機(jī)器學(xué)習(xí)算法,使機(jī)器人能夠探索自己的行為如何導(dǎo)致不同的結(jié)果。然后,機(jī)器人使用所學(xué)到的概率模型來推斷人們想要它做什么并完成任務(wù),甚至在不確定的情況下甚至“尋求”幫助。
該團(tuán)隊(duì)在兩種不同的情況下測(cè)試了其機(jī)器人模型:一個(gè)計(jì)算機(jī)模擬實(shí)驗(yàn),一個(gè)機(jī)器人學(xué)習(xí)跟隨人類的目光,另一個(gè)實(shí)驗(yàn),一個(gè)實(shí)際機(jī)器人學(xué)習(xí)模仿人類的動(dòng)作,涉及將玩具食物物體移動(dòng)到桌面上的不同區(qū)域。
在凝視實(shí)驗(yàn)中,機(jī)器人學(xué)習(xí)了自己的頭部運(yùn)動(dòng)模型,并假設(shè)人的頭部受相同規(guī)則支配。當(dāng)人類在整個(gè)房間中注視時(shí),機(jī)器人會(huì)跟蹤其頭部運(yùn)動(dòng)的起點(diǎn)和終點(diǎn),并使用該信息來確定該人正在注視的位置。然后,機(jī)器人使用其學(xué)習(xí)到的頭部運(yùn)動(dòng)模型將其固定在與人類相同的位置。
該團(tuán)隊(duì)還重新創(chuàng)建了Meltzoff的一項(xiàng)測(cè)試,該測(cè)試顯示,有視覺障礙和眼罩的嬰兒對(duì)看被蒙住眼睛的成年人不感興趣,因?yàn)樗麄兞私庠撊藢?shí)際上看不見。一旦團(tuán)隊(duì)讓機(jī)器人“學(xué)習(xí)”被蒙住眼睛的后果是什么,它就不再跟隨人類的頭部運(yùn)動(dòng)來注視著同一地點(diǎn)。
梅爾佐夫說:“嬰兒利用自身的經(jīng)驗(yàn)來解釋他人的行為,我們的機(jī)器人也是如此。”
在第二個(gè)實(shí)驗(yàn)中,團(tuán)隊(duì)讓機(jī)器人進(jìn)行了實(shí)驗(yàn),以推動(dòng)或拾取不同的對(duì)象并將它們?cè)谧烂嫔弦苿?dòng)。機(jī)器人使用該模型來模仿一個(gè)人,該人在桌上移動(dòng)物體或清除桌面上的所有東西。機(jī)器人有時(shí)并非嚴(yán)格地模仿人類的動(dòng)作,而是有時(shí)使用不同的方法來達(dá)到相同的目的。
UW的主要作者M(jìn)ichael Jae-Yoon Chung說:“如果人類將物體推到新的位置,那么帶有夾持器的機(jī)器人將其拾起而不是推到那里可能會(huì)更容易,更可靠。”計(jì)算機(jī)科學(xué)與工程專業(yè)的博士生。“但是這需要知道目標(biāo)是什么,這是機(jī)器人技術(shù)中的一個(gè)難題,我們的論文也試圖解決這個(gè)問題。”
盡管最初的實(shí)驗(yàn)涉及學(xué)習(xí)如何推斷目標(biāo)和模仿簡(jiǎn)單行為,但該團(tuán)隊(duì)計(jì)劃探索這種模型如何幫助機(jī)器人學(xué)習(xí)更復(fù)雜的任務(wù)。
梅爾佐夫說:“嬰兒通過自己的游戲和觀察他人來學(xué)習(xí),而他們是地球上最好的學(xué)習(xí)者-為什么不設(shè)計(jì)像孩子一樣輕松學(xué)習(xí)的機(jī)器人呢?”