来源:2017-04-11 08:50:00 热度:

AI在德州扑克大战中掀翻人类

AI中国网 https: //www.cnaiplus.com

经过五天的鏖战,德州扑克人工智能系统Libratus毫无悬念获得最终胜利。在这场德州扑克人机大战中,中国龙之队的六位牌手共与冷扑大师打了36000手牌,共输792327分,AI完胜人类。

比赛的结局并不出乎意料,开赛之前,创新工场创始人、董事长李开复就曾表示:“对人类能赢感到悲观,赢的概率不到10%。”事实上,今年1月,在宾夕法尼亚州匹兹堡的Rivers赌场,CMU开发的Libratus人工智能系统就曾击败过人类顶级职业扑克玩家,那场比赛共持续了20天,对玩了12万手,最终AI赢得了176万美元。

会诈唬的AI

Libratus是一个玩无限德州扑克的人工智能程序,Libratus的策略并非基于专业玩家的经验,所以它的玩牌方式可能有明显的不同。基于在匹兹堡超级计算机中心大约1500万核心小时的计算,它使用算法分析德州扑克规则,从而建立自己的策略,而且它能够在比赛中,通过预测所有未来步骤的胜率来思考自己的下一步。

与围棋强调计算和形式判断能力不同,德州扑克更讲究多人博弈过程,如何避免人性贪婪等弱点,并将科学的概率统计与灵活的实战策略很好地配合起来。在围棋、象棋等游戏中,机器和人类在决策前可以获得全部信息,而在德州扑克中,彼此无法得知对方的底牌是什么,也不知道发牌员发出的下一张牌是什么,在“不完整信息”下,人工智能需要根据经验或概率统计知识,猜测对手底牌和下一张牌的可能性,然后再制定自己的应对策略。

“如果AlphaGo是一个超级天才,冷扑大师CMU系统其实一定程度上是一个EQ专家,是靠EQ来打败你。”李开复表示。表演赛为求降低发牌中的运气因素,机器人采用复式对称发牌,两两成对的牌手其中一人将拿到与配对牌手对打的机器人底牌,因此六名牌手将拆分于两个房间和冷扑大师对阵,比赛过程中还必须确保配对牌手彼此不能碰面交流。在整个比赛中,冷扑大师也经常出现一些“诡异”的打法,例如时常超池下注,给对手造成极大的压力,并做出人类出于心理原因做不到但是正确的bluff(诈唬)。

“AI利用增强学习技术,从自我对局中学习最优的扑克玩法,而避免从人类的既定模式中学习经验,这是非常重要的一点。”李开复表示。不过,据了解,目前Libratus的算法还只适用于无限制投注的一对一比赛,如果将比赛扩展到更常见的多人制比赛,Libratus面对的挑战会更大一些,还需要进行策略上的升级与调整。

AI中国网 https: //www.cnaiplus.com

本文网址:

欢迎关注微信公众号:人工智能报;合作及投稿请联系:editor@cnaiplus.com

AI中国号...

关注微信公众号,了解最新精彩内容