新一代AlphaGo发布，100:0的实力，柯洁感叹，李世乭震惊

AI中国网 https: //www.cnaiplus.com

硬蛋，不止硬件。硬蛋（Ingdan）你的创新探索站！

▼

今天凌晨，谷歌旗下Deepmind人工智能团队发布了新一代AlphaGo，命名为AlphaGo Zero。它能够在没有人类围棋对弈数据的情况下，直接通过自我强化学习，通过短短的3天自我训练后，以100:0的战绩击败曾经的AlphaGo。

新一代AlphaGo发布，100:0的实力，柯洁感叹，李世乭震惊-硬蛋资讯/

想想曾经在AlphaGo面前陷入长考甚至落泪的柯洁，不禁令人感叹。老版AlphaGo已经超越人类认知，新版AlphaGo Zero则向人类宣誓，只有它自己才能做自己的老师。

AlphaGo的首席研究员David Silver称：“它比以前的算法更强大，因为它不使用任何人类数据或人类经验，我们已经消除了人类知识的限制，它可以自己创造知识。”

今天凌晨，谷歌旗下Deepmind人工智能团队在期刊《Nature》上发布了一篇轰动AI界的论文，《Mastering%20the%20game%20of%20Go%20without%20human%20knowledge》（在没有人类知识的情况下掌握围棋）。Deepmind宣布一款新版的AlphaGo%20Zero计算机程序可以在不需要任何人类输入的条件下，迅速自学围棋，并以100比0的战绩击败上一代AlphaGo。这是AI历史上又一里程碑式的重大消息

AlphaGo%20到底有多厉害？

之前的版本经过大量的人工对弈数据学习和训练，以Master的身份成为世界第一。而 AlphaGo%20Zero是从一个完全不懂围棋知识和规则的神经网络开始，完全不使用人类数据的情况下取得了现在的进展。

在增强学习过程中，神经网络不会参考任何前辈的知识，是完全的左右互搏，通过不断更新、调整以预测落子的位置，制定新的策略。

值得注意的是，此前的AlphaGo需要利用48个TPU、花几个月的时间才打败了人类。新版AlphaGo%20Zero的神经网络异常强大，%20只需要用4个TPU花3天，就可以训练490万局棋，达到了击败李世乭的水平，21天击败柯洁，40天天下无敌。

此次，最新版的AlphaGo Zero最大的突破在于实现了“白板理论”。白板理论认为，婴儿是一块白板，可以通过后天学习和训练来提高智力。人工智能(AI)的先驱图灵认为，只要能用机器制造一个类似于小孩的AI，然后加以训练，就能得到一个近似成人智力，甚至超越人类智力的AI。而自学成才的AlphaGo Zero正是实现了这一理论。

什么是增强学习？

我们常听到的深度学习，是利用大量数据训练神经网络，也就是老版本AlphaGo的模式。新版AlphaGoZero采用的增强学习完全不使用人类数据，极大减少了对数据的依赖。

具体的原理细节会显得晦涩难懂，感兴趣的朋友可以搜索微信公众号硬蛋（微信号：hardeggs），后台回复「最强围棋」，获取Deepmind发表的论文原文。

DeepMind团队还表示，这个项目不仅仅是为了获得对围棋更深的认识，AlphaGoZero向人们展示了即使不用人类的数据，人工智能也能够取得进步。最终这些技术进展应该被用于解决现实问题，增进人类的认知，从而改善每个人的生活。

新一代AlphaGo发布，100:0的实力，柯洁感叹，李世乭震惊-硬蛋资讯/