网络在线手游棋牌 棋牌热点 会骗人的AI,DeepTexas团队推出国内首个扑克比赛AI

会骗人的AI,DeepTexas团队推出国内首个扑克比赛AI

混沌研究院成功研发国内首个智能决策人工智能机器人:神策·DeepTexas,并应用于扑克比赛中,从而让AI更接近人类,进而超越人类。

AlphaGo的深度学习技术在围棋中展现的实力,即人工智能在有章可循、完美信息的情况下,可以展现的超越人类的计算能力。但现实世界错综复杂, 90%以上的场景都是非完美信息,甚至包括对人类想法的推测,这是AlphaGo所力所不及的。而混沌研究院所研发的国内首个智能决策类人工智能机器人:神策·DeepTexas,却另辟蹊径,攻克了这个旷日持久的难题。其独创的算法:Fast-Net、FRM、TSW,能结合神经网络,运用机器学习、强化学习、蒙特卡洛算法,让人工智能不仅拥有对完美信息的处理能力,更拥有对非完美信息的解析和决策能力。

在人工智能领域的创新中,扑克与麻将类似,都比围棋比赛有更严格的“决策”要求。即在包含几率、可能性、推测的情景中,人工智能要对这些信息进行处理,并根据情景进行推理,从而做出相应的决策。“神策·DeepTexas”通过多年的研究,凭借在扑克比赛中的实践,终于拥有了“直觉”与“智能决策”。

那么,人工智能研究者为何选择德州扑克?

人工智能已经精通了多种棋类游戏,包括国际象棋和围棋等复杂的策略类游戏。而德扑比棋类游戏更为复杂,这是因为它有一处显著不同——选手必须在无法得知赛局所有信息的情况下,制定自己的策略。他们必须根据对下注等过程的观察,猜测对手有什么手牌,并考虑对手对于他们自己的手牌又有怎样的猜测。

这样的“不完全信息”博弈更贴近现实生活中解决问题的场景。例如,在拍卖和金融谈判中,就会出现类似情况。而扑克则成为了测试人工智能是否能应对这种情景的平台。

人工智能已经掌握了较简单的扑克玩法:阿尔伯塔团队已经于2015年基本掌握了双人有限注德州扑克。DeepStack和Libratus挑战的仍然是双人德州扑克,但下注、跟注的筹码没有上限——正因如此,无限注玩法对于人工智能程序来说更为复杂,也更难掌握。包括我们DeepTexas团队目前也致力于研究“1V1无限注德扑AI”甚至“多人德州扑克”。难度很大,但对一个科研团队来说,更具挑战和研究的深远意义。

德州扑克人工智能背后有什么数学原理?

  • 博弈论。德州扑克人工智能需要摸索出在任何情况下,无论对手如何应对,都能必赢的策略。根据博弈论理论,在一对一德扑这样的零和博弈(即一方有所得,另一方必有所失)里面,这样必赢的策略必然存在。人类选手可能会利用较弱对手的失误而赢得很多筹码,而使用上述策略的人工智能则不在乎赢取筹码的多寡——对于它而言,只要赢得牌局就好。这意味着它不会因为对手的意外之举而不知所措、自乱阵脚。从博弈论来说,德扑AI通过选取GTO最优策略,以达到纳什均衡。换句话说,德扑AI找到了对手的弱点,但没有暴露自己的弱点,找到了一个新的平衡点。
  • 虚拟遗憾最小化算法(CounterFactual Regret Minimization,简称CFR),这也是德扑AI的核心算法这是一个类似强化学习的算法,但是更高效。让AI之间对战德扑,采用随机的策略,然后每局过后看看在什么地方后悔了,然后尝试不同的战略,再在决策点上复盘。这个算法与人类学习德州类似:累积经验、评判自己的选择,但需要注意的是,这里正确的“后悔点”非常重要。德州扑克有很强的随机性,所以很容易陷入错误的学习方式。简而言之,德扑AI就是利用CFR算法在尝试不同的策略中累积经验和评估选择,不断于决策点复盘后最小化后悔值。

算法很简单,问题是无限德州的空间太大了,复杂度是10的160次方。有几种解决方案:合并简化+CFR(Claudico),CFR+“直觉”(DeepStack),CFR+End Game Solver+RL(Libratus)。

人工智能是否也会诈唬(bluff)?

会。通常人们认为诈唬是人类才会做的行为,至于计算机,它们不会去了解、预测对手行为,而是完全基于牌局中隐含的数学原理而进行决策。诈唬通常只是为防止对手通过自己的下注规律猜到自己手牌而采取的一种策略。

人工智能掌握扑克玩法,是否意味着线上扑克游戏的终结?

不是。虽然顶级选手已经开始进行人机对战训练,但多人德州扑克还未被攻破,且许多线上扑克游戏禁止玩家在赛局中使用计算机,目前更多地被用于人机对战训练。

如何据此看待人工智能未来的发展?

能够在这种不完整信息博弈中战胜人类,是人类在探索和解决具有不完整信息问题的一大进步。而这些探索在未来也能更好地用于解决同类具有不完整信息的实际问题。如这种人工智能也许能被用于金融和网络安全中的复杂现实世界问题。

本文来自网络,不代表网络在线手游棋牌立场,转载请注明出处:https://mip.qidake.com/18358/

作者: qipai

上一篇
下一篇

发表评论


返回顶部