OpenAI實驗證明 即使是機器人也可以在捉迷藏中作弊
2021-03-09 07:47:32
?
來源:
導讀 在競爭激烈的世界中,人工智能能否進化并變得更加復雜,類似于地球上的生命如何通過競爭和自然選擇進化而來?這是一個問題,OpenAI的研究人
在競爭激烈的世界中,人工智能能否進化并變得更加復雜,類似于地球上的生命如何通過競爭和自然選擇進化而來?這是一個問題,OpenAI的研究人員一直試圖通過其實驗來回答這個問題,包括最近一次讓AI代理人在近5億次捉迷藏中相互競爭的問題。他們發(fā)現(xiàn)AI代理人或機器人能夠在他們玩的時候想出幾種不同的策略,開發(fā)新的策略以對抗其他團隊提出的技術(shù)。
起初,躲貓貓和尋求者只是在環(huán)境中奔跑。但是在經(jīng)過2500萬場比賽之后,這些陌生人學會了如何使用盒子阻擋出口并在房間內(nèi)設置障礙物。他們還學會了如何相互合作,將盒子相互傳遞以快速阻止出口。然后,尋求者通過將舷梯移動到墻壁上并利用它們來克服障礙,在7500萬場比賽之后學會了如何在這些堡壘中找到躲藏者。然而,在大約8500萬場比賽之后,躲藏者們學會了在阻擋出口之前帶著他們進入堡壘內(nèi)的坡道,所以尋求者沒有工具可以使用。
正如OpenAI的Bowen Baker所說:
“一旦一個團隊學會了一個新的戰(zhàn)略,它就會給另一個團隊帶來壓力。它有一個非常有趣的類比,就是人類如何在地球上進化,你們之間的生物之間會不斷競爭。”
代理商的發(fā)展甚至沒有止步于此。他們最終學會了如何在他們的環(huán)境中利用毛刺,例如通過以一定角度推動它們穿過墻壁來擺脫斜坡。鮑爾表示,這表明人工智能可以找到我們可能沒有想到的復雜問題的解決方案。“也許他們甚至能夠解決人類還不知道如何解決的問題,”他解釋道。
免責聲明:本文由用戶上傳,如有侵權(quán)請聯(lián)系刪除!