歡迎來到 - 七方八面來風網,您是本站的第   273842    位訪客。         注冊|登陸
棗陽新聞 荊楚新聞 國內新聞
返回首頁
當前位置: 首頁 > 社會新聞 > 七方新聞 >

玩躲貓貓游戲 AI學會攻防術

時間:2020-04-16 23:11來源:網絡整理 作者:七方八面來風網 點擊:
東方網-東方新聞-社會新聞-玩躲貓貓游戲 AI學會攻防術-

    盡管機器學習在諸如圍棋和Dota 2等復雜游戲中取得了顯著進步,但在這些范疇掌管的本事并不一定能推廣到的確場景中實際應用。越來越多的商討人員正在探求建立一種機器智能,使其動作、學習和進化更像人類。

    總部位于舊金山的OpenAI公司近日發表的一篇新論文提出,在兒童的“躲貓貓”游戲中熬煉模型,并在數以千萬計的競賽中使它們相互對抗,可導致模型自動發展出雷同人類的動作,從而提高智力并改善后續行動的性能。

    為什么選取躲貓貓?

    該論文的第一作者、OpenAI商討員博文·貝克認為,躲貓貓被選為一個有趣的起點,主假若因為其端正很純正。所有游戲中的代理(Agent,也稱智能體,指能自主活動的軟件或硬件實體)都被模擬為球形方向,可施行3種模范的操作:導航、抓住并移動物體、鎖定方向,且只能由該代理的隊友解鎖。

    商討人員在模擬的、物理接地的環境中安設了1—3個“躲藏者”和1—3個“尋覓者”,房間的邊界是靜態墻。環境中還包括不同尺寸的可移動箱子和可移動坡道。

    商討人員使用強化學習來熬煉游戲代理,并苦守純正的躲貓貓端正:陰事者成功躲過尋覓者的追逐,或是尋覓者成功找到躲藏者。

    AI如何玩躲貓貓?

    在始末數億次的游戲后,AI代理經由了幾個階段的策略發展過程。

    在初始階段,躲藏者(藍色)和尋覓者(紅色)通過在空間中移動而不把握任何物體,制定了優秀粗糙的遁藏和追逐策略。

    在經由2500萬個回合后,游戲變得更加復雜。躲藏者學會了移動和鎖定在環境中的箱子和路障,以在自己規模建立堡壘,這樣尋覓者就悠久看不到它們了。不僅如此,他們還制定了轉圜戰略,例如相互傳遞物體,以加快制造堡壘的歷程。

    然而,在游戲進行了7500萬回合之后,尋覓者發現了一個反策略。他們學會了在躲藏者的要塞旁邊移動一個坡道,并用它來爬過墻壁。

    手腳回應,躲藏者學會了將坡道移入他們的房間,因此尋覓者無法用它來超出墻壁。

    隨著環境變得越來越復雜,躲藏者學會了使用細長箱子制造更遠大的“堡壘”。雖然OpenAI認為這將是最終的策略,但在游戲進行到3.8億回合時,尋覓者再次成功報復,找出一種技巧來跳到一個盒子上并詐欺動力在它上面“沖浪”,超出墻壁進入堡壘。

    在最后階段,躲藏者學會在制造堡壘之前鎖定所有箱子,以防止“箱子沖浪”。

    商討人員將這些不同策略的演變稱為“來自多智能體自動課程的弁急本事進展”。“自動課程”這一術語是今年由DeepMind建筑的,適用于多個代理逐漸建筑新做事以在特定環境中相互尋事。OpenAI的商討人員認為,這個過程在自然選取方面具有近似之處。

    這項商討為啥很嚴重?

    鑒于躲貓貓相對純正的目標,通過競爭性自我游戲熬煉的多個代理學會了使用工具,并采取人類相關本事來獲勝。OpenAI認為,這為未來的智能代理開辟和鋪排提供了一個有前景的商討對象。OpenAI正在開源其代碼和環境,以熒惑在該范疇進一步商討。

    OpenAI的最終目標是構建能夠在一個通用編制中施行多項做事的人工通用智能(AGI)。雖然或許會有不同的目標,但OpenAI正在大舉投資由大周圍籌劃才氣完成的強化學習商討。OpenAI最近與微軟簽署了一份價值10億美元的為期10年的籌劃合同。

    躲貓貓游戲商討也激發了OpenAI,因為隨著環境復雜性的增添,游戲中的代理貫串地通過新策略自我好看新的尋事。貝克表露:“如果擴展像這樣的流程,并將其放入更復雜的環境中,那么你或許會得到充滿復雜的代理,以便為我們處置實際做事。”

    尋事在哪里?

    游戲代理有時會闡發出令人吃驚的動作。例如,躲藏者試圖絕對逃離游戲區域,直到商討人員對此施加懲罰。

    其他尋事或許歸因于模擬環境設計中的物理空位。例如,躲藏者體認到,如果他們在拐角處向墻壁推動斜坡,斜坡將由于某種開頭穿過墻壁然后消失。這種“作弊”闡明了算法的安定性如何在機器學習中發揮關鍵作用。商討人員說:“在它發生之前,你悠久不會知道。這類編制總是存在空位。我們所做的根蒂上是寓目,以便我們可以看到這種奧秘的事情發生,然后試著修復物理空位。”

    (科技日報紐約9月17日電 馮衛東)

    [ 責編:張夢凡 ]

(責任編輯:admin)
頂一下
(0)
0%
踩一下
(0)
0%
------分隔線----------------------------
推薦內容
二維碼
欧冠各小组积分排名