网络在线手游棋牌 棋牌热点 哪里有开源的德州扑克AI算法

哪里有开源的德州扑克AI算法

「冷扑大师」 (Libratus) 是如何利用博弈论打德扑的?

或许我在这个问题下的回答会更加清楚一点。

Counterfactual Regret Minimization 及其变种都是用来求解Poker中的Nash equilibrium。但是由于目前的计算能力不足以直接解决二人非限制性德州扑克,所以会先abstraction(card abstraction, bet abstraction),再在abstraction game 上求解近似的Nash equilibrium。在online的时候,为了提高agent的能力,通常会采用Endgame solving 来实时优化策略。

当然还有最近新出来的DeepStack

我知道,这篇文章介绍战胜人类玩家的扑克AI,所需的人工智能技术,以及相应的算法公式。

不懂的地方来问我啊!。◕‿◕。

arxiv.org/pdf/1701.01724v1.pdf

还有这篇文章,详细介绍扑克与人工智能的理论,我写滴,别忘给赞啊!

如何看待人工智能系统 Libratus 战胜四位德州扑克顶级选手,获得最终胜利?扑克的主流算法还是cfr,还有一个非主流的mcts框架上的information set。这些都可以直接google到。

至于实现,暂时还没有听说过。德扑ai一直是冷门,学界在做的也就那几家。他们一直没有开源,其他地方估计也难

我写过三人push/fold的fictitious play。

2+2上有人贴了2人push/fold fictitious play的代码,楼主可以找找。

卡内基梅隆(CMU)大学在NIPS2017中公布了一些关键技术,这篇论文不错:

德州扑克AI(Libratus)的背后:不完美信息博弈中,求解安全嵌套的子博弈, #NIPS 2017最佳论文奖

本文来自网络,不代表网络在线手游棋牌立场,转载请注明出处:https://mip.qidake.com/17728/

作者: qipai

上一篇
下一篇

发表评论


返回顶部