来源:2017-10-20 12:01:20 热度:

新一代AlphaGo发布,100:0的实力,柯洁感叹,李世乭震惊

AI中国网 https: //www.cnaiplus.com

硬蛋,不止硬件。硬蛋(Ingdan)你的创新探索站!


今天凌晨,谷歌旗下Deepmind人工智能团队发布了新一代AlphaGo,命名为AlphaGo Zero。它能够在没有人类围棋对弈数据的情况下,直接通过自我强化学习,通过短短的3天自我训练后,以100:0的战绩击败曾经的AlphaGo。


新一代AlphaGo发布,100:0的实力,柯洁感叹,李世乭震惊-硬蛋资讯/


想想曾经在AlphaGo面前陷入长考甚至落泪的柯洁,不禁令人感叹。老版AlphaGo已经超越人类认知,新版AlphaGo Zero则向人类宣誓,只有它自己才能做自己的老师。



AlphaGo的首席研究员David Silver称:“它比以前的算法更强大,因为它不使用任何人类数据或人类经验,我们已经消除了人类知识的限制,它可以自己创造知识。”


今天凌晨,谷歌旗下Deepmind人工智能团队在期刊《Nature》上发布了一篇轰动AI界的论文,《Mastering%20the%20game%20of%20Go%20without%20human%20knowledge》(在没有人类知识的情况下掌握围棋)。Deepmind宣布一款新版的AlphaGo%20Zero计算机程序可以在不需要任何人类输入的条件下,迅速自学围棋,并以100比0的战绩击败上一代AlphaGo。这是AI历史上又一里程碑式的重大消息


AlphaGo%20到底有多厉害?

之前的版本经过大量的人工对弈数据学习和训练,以Master的身份成为世界第一。而 AlphaGo%20Zero是从一个完全不懂围棋知识和规则的神经网络开始,完全不使用人类数据的情况下取得了现在的进展。

在增强学习过程中,神经网络不会参考任何前辈的知识,是完全的左右互搏,通过不断更新、调整以预测落子的位置,制定新的策略。

值得注意的是,此前的AlphaGo需要利用48个TPU、花几个月的时间才打败了人类。新版AlphaGo%20Zero的神经网络异常强大,%20只需要用4个TPU花3天,就可以训练490万局棋,达到了击败李世乭的水平,21天击败柯洁,40天天下无敌。





此次,最新版的AlphaGo Zero最大的突破在于实现了“白板理论”。白板理论认为,婴儿是一块白板,可以通过后天学习和训练来提高智力。人工智能(AI)的先驱图灵认为,只要能用机器制造一个类似于小孩的AI,然后加以训练,就能得到一个近似成人智力,甚至超越人类智力的AI。而自学成才的AlphaGo Zero正是实现了这一理论。



什么是增强学习?


我们常听到的深度学习,是利用大量数据训练神经网络,也就是老版本AlphaGo的模式。新版AlphaGoZero采用的增强学习完全不使用人类数据,极大减少了对数据的依赖。



具体的原理细节会显得晦涩难懂,感兴趣的朋友可以搜索微信公众号硬蛋(微信号:hardeggs), 后台回复最强围棋」,获取Deepmind发表的论文原文



DeepMind团队还表示,这个项目不仅仅是为了获得对围棋更深的认识,AlphaGoZero向人们展示了即使不用人类的数据,人工智能也能够取得进步。最终这些技术进展应该被用于解决现实问题,增进人类的认知,从而改善每个人的生活。


新一代AlphaGo发布,100:0的实力,柯洁感叹,李世乭震惊-硬蛋资讯/


但是,我们对人工智能的发展也不能太乐观。围棋毕竟是一种规则明确的游戏,无数据自学习是可以实现的。但是实际生活中像语音识别,图像识别等领域,仍然需要大量的人工标注作为基础,然后才能让机器自学。我们只有期待未来技术发展进一步加速,尽早造福全人类。

AI中国网 https: //www.cnaiplus.com

本文网址:

欢迎关注微信公众号:人工智能报;合作及投稿请联系:editor@cnaiplus.com

AI中国号...

关注微信公众号,了解最新精彩内容