人工智能在游戲領域再進一步

【人工智能在游戲領域再進一步】

人工智能在游戲領域再進一步



美國麻省理工學院科研團隊19日宣布 , 其開發的人工智能程序“深度角色”(DeepRole)在一個玩家角色和動機不明的在線游戲中勝過人類 , 成為首個在敵友不明的多玩家游戲中戰勝人類玩家的人工智能程序 。
研究顯示 , 通過在算法中使用“演繹推理” , “深度角色”根據觀察到的部分行為 , 推斷某一玩家是敵是友 , 快速學習應該與誰結盟從而獲得勝利 。
今年7月 , 美國卡內基-梅隆大學宣布 , 人工智能Pluribus在六人桌德州撲克比賽中擊敗多名世界頂尖選手 , 突破了人工智能僅能在國際象棋和圍棋等二人游戲中戰勝人類的局限 。 但在這些游戲中 , 人工智能從一開始就知道“誰是敵人、誰是朋友” 。
研究人員讓“深度角色”參與了超過4000輪在線桌游“抵抗組織:阿瓦隆” 。 “阿瓦隆”類似于“殺人游戲”或“狼人殺” , 玩家通過游戲進程推測出其他玩家的身份 , 同時掩藏自己的身份 。 結果顯示 , 不論作為“好人”還是“壞人” , “深度角色”都比人類玩家表現更加出色 。
“深度角色”采取了一種被稱為“反事實遺憾最小化”的博弈算法 , 利用“博弈樹”預測每個玩家的行為 , 并推斷出玩家角色的最大可能性 。 這種人工智能程序在游戲中進行自我對抗 , 逐步接近最佳策略 , 實現“至少與對手打平”的納什均衡 。
“阿瓦隆”的人類玩家通常要在游戲過程中通過對話為決策提供部分依據 , 而“深度角色”只觀察玩家行為 , 無需參與交流 。 研究人員未來計劃讓機器表達簡單的信息 , 如玩家是敵是友等 。
語言是人工智能的下一個前沿 , 因為人類玩家會說謊 , 需要更復雜的交流技巧 。 只有掌握表達技巧后 , 人工智能才能參與那些需要對其他玩家進行勸說的復雜社交推理游戲 。
研究人員說 , 這項工作可以更好模擬人類是如何做出社會決策的 , 從而幫助人工智能更好理解人類、向人類學習并與人類共事 。

    推薦閱讀