人工智能时代,猜拳能公平吗?
猜拳在决策上用了很久,在生活中没有太多思考。一般认为玩家获胜的概率应该是一样的,也就是30%左右。从长远来看,这使得任何玩家都有可能赢、平或输。这就是所谓的混合策略纳什均衡,每个参与者在每一轮中以相等的概率选择三个行动。
但事实可能并非如此。来自浙江大学的研究团队发现,真实玩家的策略看似随机,但实际上它们是由可预测的模式组成的,狡猾的对手可以利用这些模式来获得重要的优势。
具体来说,研究团队开发了一个基于n阶马尔可夫链的人工智能模型——Multi-AI,这意味着Multi-AI是有记忆的,可以追溯到n。
历史状态并使用它。研究人员将个体模型结合起来,以应对人类玩家的不同个性和策略。
如果人类玩家接连获胜,将推动多AI。
转而选择其他人工智能模型更好的解决方案。如果人类玩家连续失败,很可能会改变策略或者打破之前的打卡规则,然后多AI也可以相应调整。
这意味着不同的游戏策略。也就是说,多AI模型强调及时调控不同玩家之间的性格差异和打卡策略,选择当前最适合的游戏策略。
最终的实验结果显示,在与52名人类玩家进行了300轮战斗后,人工智能击败了95%的玩家。因为游戏规则是赢+2分,平+1分,不失分,而且所有参与者都知道获胜者会得到金钱奖励。总分越高,赢钱越多,所以玩家故意放水或者随机选择的可能性极小。
即便如此,人工智能还是战胜了人类。在最悬殊的较量中,人工智能取得了198场胜利,55场平局,仅输了47场,胜率比人类对手高4倍。
当然,这一最新的猜拳研究成果不仅是一个强大的猜拳人工智能,也是一个强大的循环制衡模型分析师,这意味着人类的竞争行为确实有规律可循,并且可以通过使用适当的简单模型来利用这些规律。研究人员认为,人工智能模型未来有望扩展到其他游戏场景,如预测竞争对手的下一步行动,规划更有效的战役策略,或制定更有利的定价方案。