哈萨比斯:
DeepMind创始人接受专访:人工智能将塑造未来

 

DeepMind创始人接受专访:人工智能将塑造未来

腾讯科技讯 3月14日,据国外媒体报道,谷歌(微博)旗下人工智能公司DeepMind的AlphaGo程序击败韩国围棋冠军李世石(Lee Se-dol),成为近年来人工智能领域少有的里程碑事件。但是AlphaGo至今还只是个程序,甚至不是谷歌的主要项目。但DeepMind创始人杰米斯·哈萨比斯(Demis Hassabis)不久前曾说过,DeepMind想要解决“智慧问题”,而他对如何实现这个目标有很多想法。

哈萨比斯本人拥有不同寻常的经历,但对实现“解决智慧问题”的目标似乎非常有用。这位国际象棋神童曾五次获得脑力奥林匹克运动会(Mind Sports Olympiad)全能脑力王(Pentamind)称号,年轻时即在英国电脑游戏开发商Bullfrog和Lionhead中声名鹊起,曾帮助研发人工智能游戏《主题公园》、《黑或白》等,此后组建了自己的工作室Elixir。在2000年中期,哈萨比斯离开游戏行业,并获得神经系统科学博士学位,2010年创建了DeepMind。

TA
讲述

互动
问答
互动提问,哈萨比斯回答

      AlphaGo首次战胜李世石后,哈萨比斯接受了美国科技媒体网站The Verge记者萨姆·拜福德(Sam Byford)专访,除了探讨AlphaGo,他还畅谈了视频游戏、下一代智能手机助手、DeepMind在谷歌承担的角色、机器人以及人工智能如何帮助科学研究等话题。文章摘要如下:

      1.AlphaGo成为人工智能研究领域的“圣杯”

      拜福德:对于那些不怎么了解人工智能或AlphaGo的人,你如何描述昨天发生的“文化共鸣”现象?

      哈萨比斯:AlphaGo已经达到完美信息游戏的巅峰,围棋远比国际象棋复杂得多,所以它始终是人工智能研究面临的“圣杯”或“巨大挑战”,特别是自“深蓝”以来。众所周知,尽管我们进行了很多努力,但距离目标依然很遥远。10年前,蒙特卡洛树搜索研究是一大创新,但我认为AlphaGo引入了直觉方面的神经网络,这才是区分最顶级棋手的关键。

      拜福德:当你看到AlphaGo下棋时,你会为其特定动作感到惊讶吗?

      哈萨比斯:我会,我们都感到非常震惊。我认为李世石也是如此,这从他的面部表情就可看出来。比如当AlphaGo将棋子下入左侧,深入李世石的领地后,我想那是个出人意料的举动。

      拜福德:因为这代表侵略性?

      哈萨比斯:的确,代表着侵略性和无畏。此外,AlphaGo也在以李世石擅长的策略发动反击。李世石向来以创造性攻击战闻名,而我们也正期望如此。游戏开始时,李世石开始在整个棋盘上布局,对于传统电脑为其程序来说,它们在这方面始终存在短板。它们善于局部计算,但是当放眼全局时,它们的表现就会很糟糕。

      拜福德:最初举行次类比赛的重要原因是评估AlphaGo的能力,你从它与李世石的首场对战中有什么感悟吗?

      哈萨比斯:我猜我们应该继续沿着当前方向研究,这并未出乎我们的预料。我们曾告诉人们,我们认为比赛胜负难料。我认为任何事都可能发生,我知道李世石可能会采取不同的战略。因此我认为接下来的比赛更值得期待。

      刚刚谈及了AlphaGo对于人工智能研究的重要意义,现在我回答你的第一个问题:AlphaGo与深蓝的差异。深蓝是“手工研发”的程序,程序员筛选国际象棋大师的信息,将其转化为具体规则和启发,而我们为AlphaGo植入了学习能力,它可以通过练习和学习积累更多经验,这与人类更为相似。

      2.最终将被用于解决现实世界大问题

      拜福德:如果AlphaGo继续以同样方式获胜,接下来要做什么,将来是否继续人工智能PK人类的游戏?

      哈萨比斯:我认为对于完美信息游戏来说,围棋就是巅峰。当然,可能还有其他顶级围棋大师与之对战,有些游戏也非常困难,多名玩家参战也将产生更大挑战,因为那将不再是完美信息游戏。此外还有各种各样的视频游戏,人类的表现也远超过计算机,比如韩国游戏《星际争霸》。在非完美信息世界中,战略游戏要求更高水平的策略能力,这被称为“永远不可能感知到整个世界”。在围棋游戏中,你可以在棋盘上一目了然地看到全局,对于计算机来说相对容易。

      拜福德:你对亲手打赢《星际争霸》游戏感兴趣吗?

      哈萨比斯:或许。在一定程度上,我们只对那些有助于我们研究计划的东西感兴趣。DeepMind的目标不仅仅是获得游戏胜利,还要从中获得乐趣和启发。但从个人角度来说,我喜欢玩游戏,我也曾开发过电脑游戏。可是从某种程度上说,它们又都是试验台,即尝试编写算法并对其进行测试的平台。最终,我们希望能将技术应用于解决现实世界的难题。

      DeepMind创始人接受专访:人工智能将塑造未来

      拜福德:我在20世纪90年代末的英国长大,曾在电脑杂志上看到过你的名字,将其与许多雄心勃勃的游戏联系起来。当我首次听说DeepMind和看到你的名字时,我就想“它们很相配”。你能描述下你此前在游戏行业的经历对你现在从事的工作的影响吗?

      哈萨比斯:创建类似DeepMind这样的公司一直是我的终极目标,我已经为此准备了20多年。如果你了解我曾做过的全部事情,最后会发现它们都是人工智能研究的开始,这也是我选择现在这条路的初衷。如果你熟悉我在Bullfrog的工作,你会发现人工智能是我所编写所有代码的核心。我16岁开始开发《主题公园》,对我来说,那是开创性的时刻,让我意识到人工智能的强大,以及我们应该如何继续扩展它。我们出售了数百万份游戏拷贝,许多人都喜欢玩这款游戏,因为人工智能适应了你的游戏方式。我们继续前进,试图在我的游戏生涯中取得更大进展,此后我重返大学进修,因为我在2000时觉得通过开发游戏过程中留下的后门,会让人工智能研究越走越远。但这很难,毕竟开发商只希望开发流行游戏。

      拜福德:游戏是人工智能最明显的应用吗?

      哈萨比斯:我认为是如此,我们正研发非常先进的人工智能。在我20世纪90年代读大学时,这些新技术还没有真正流行起来,比如神经网络、深度学习、强化学习等。因此,实际上最好的人工智能都被应用在游戏中。但它们不是我们正在研发的学习型人工智能,而是属于有限态机器(finite-state machines),但它们依然十分复杂。《黑或白》等游戏使用了强化学习技术,我认为它依然是这款游戏中最复杂的技术。但是在2004年到2005年,游戏行业显然与20世纪90年代不同,变得更有趣、更有创意,你只需想出创意,就可开发任何游戏。但这个行业也变得不再有趣,为此我开始收集不同信息,准备创建DeepMind。我希望从大脑如何解决问题方面获得灵感,为此选择了攻读神经科学博士学位。

      3.学习型人工智能将提升游戏行业整体水平

      拜福德:这或许是短期可实现的目标,你将发挥人工智能优势,并将它们应用到当今游戏中?

      哈萨比斯:坦白地说,很多领域都可使用人工智能技术,我也很喜欢那样做。但是限于带宽的束缚,我们的重点将集中于医疗和推荐系统等。但我认为,这将是个巨大的市场,如果拥有智能适应性人工智能对手,我认为游戏开发者将会喜欢它,他们在开发每款游戏时无需再开发新的人工智能,或许他们只需在自己的游戏中训练人工智能即可。

      拜福德:我可以想到,当你在家中打视频游戏时,可能因为没有非玩家角色而到异常沮丧。

      哈萨比斯:的确如此,在大型多玩家游戏中,这总是令我感到很沮丧,因为非玩家角色通常都非常沉默。他们没有任何记忆,没有任何改变,没有任何背景。但我认为,如果有了学习型人工智能,视频游戏的整体水平将获得极大提高。

      拜福德:将来你开发的人工智能将主要应用于医疗、智能手机助手以及机器人方面。在医疗方面,IBM的人工智能Watson已经在诊断癌症方面取得很大进展,DeepMind的目标是什么?

      DeepMind创始人接受专访:人工智能将塑造未来

      哈萨比斯:DeepMind的开发还处于早期阶段。我们已经与NHS结为合作伙伴,但才刚刚开始开发可用于医疗领域的机器学习平台。我认为Watson的目标与我们完全不同,与我对人工智能的理解也有差异。它就像一个专家系统,属于完全不同的人工智能。我认为你将看到我们的人工智能对图片进行医学诊断,然后纵向追踪生命体征或量化自我,帮助人们过上更健康的生活方式。我认为那非常适合使用强化学习。

      拜福德:与NHS合作后,你们推出的应用似乎并未太多使用人工智能或机器学习技术,这是为什么?为何NHS使用这款软件,而其他组织未采用?

      哈萨比斯:就我个人理解,NHS的软件相当糟糕,因此我认为首先应帮助其实现现代化。他们的系统不支持移动技术,许多技术都非常落后,这令人十分沮丧。我认为,对于医生、护士来说,这会导致他们效率低下。因此,首先需要帮助他们获得更有用的工具,比如可视化和基本统计等工具。我们将开始研发这些软件,此后更复杂的机器学习技术将被融入其中。

      拜福德:推销这种技术容易吗?显然,在英国投资医疗是个有争议的话题。

      哈萨比斯:我们都是免费提供技术,这应该令其更容易推销。这与大多数软件公司可能截然不同。几乎开发这种软件的都是跨国大公司,它们并非真正在乎用户,而我们以初创企业的方式去设计它,真正倾听来自用户的反馈,并且不断重新设计它。

      4.智能手机助手应该变得更智能化

      拜福德:我们再谈谈智能手机助手。我看到你曾在演示中播放科幻爱情片《她》的幻灯片,那是你的终极目标吗?

      哈萨比斯:我认为,《她》只是很容易流行和接受的主流观点,我们都认为智能手机助手实际上应该更加智能化,能够识别语境,可以深入了解你正尝试要做的事情。但与此同时,大多数此类系统都是预编程的。这意味着,一旦你去掉了预编程,它们就变得全无用处。因此,我们将开发适应性更强、更灵活、更强大的智能手机助手。

      拜福德:在这些改进中需要哪些技术突破?为何我们不能在近期内实现?

      哈萨比斯:我只是认为你需要不同的方法。再次强调下,这是预编程与机器学习的重要区别。目前几乎所有智能手机助手都是预编程的,那意味着它们相当脆弱,只能做些程序员设定的事情。而现实世界却非常混乱和复杂,用户会做各种各样提前不可预知的事情。在DeepMind,我们认为这是基础性原则,开发人工智能的唯一方式就是通过学习和练习积累经验。

      拜福德:AlphaGo也是从被教导许多游戏模式开始的,如何才能用于输入方式各不相同的智能手机?

      哈萨比斯:有无数相关数据,你可以从中学习。实际上,AlphaGo算法就是未来数月我们研发的重点,我们认为它可以摆脱最初的监督式学习,完全进入自我发挥的学习模式。这可能花费更长时间,因为当你随机去玩游戏时需要更长时间训练,期间还需要测试,有时候会出现错误。但我们认为,这才是纯粹的学习方式。

      拜福德:这是因为当前算法已经支持这种可能吗?

      哈萨比斯:不,我们以前曾做到过。它不会让程序更强大,只是纯粹的学习,无需进行监督。我们认为这种算法可在没有监督的情况下运行。我们去年开发的雅达利(Atari)游戏不会启动任何人类知识,仅仅在屏幕上随机学习。

      拜福德:这是否更容易,因为失败状态变得更明显?

      哈萨比斯:这的确更容易,因为分数变得更常见。在围棋中,你真正需要的就是得分,不论你在最后输赢。这就是所谓的“信贷分配问题”:当你在围棋中走了100步后,你却不知道哪一步是确保你获胜或导致你输棋的关键,因此信号相当弱。然而在雅达利游戏中,你正在做的大多数事情都会以分数的形式展示出来,因此更有迹可循。

      DeepMind创始人接受专访:人工智能将塑造未来

      拜福德:你能做出预测,人们使用的智能手机何时会出现明显进步吗?

      哈萨比斯:我认为在未来2到3年中,你会看到智能手机发生巨大变化。我的意思是,手机将出现非常微妙的变化,某些方面变得更好。或许在4到5年后,你会开始看到智能手机性能发生更大改变。

      5.谷歌支持对AlphaGo非常重要

      拜福德:你已经确定了所有的未来可能性,这些是与谷歌存在的最明显联系。你认为这种技术适用于谷歌产品或业务模式吗?

      哈萨比斯:不,在优化研究进展方面,我们有相当大的自主权。这是我们的使命,也是我们加入谷歌的初衷。但这可能需要数年时间。当然,我们实际上也参与到许多谷歌内部产品开发中,但都处于早期阶段,因此还不方便现在加以讨论。智能手机助手是非常核心的部分,我认为桑达尔·皮查伊(Sundar Pichai)已经多次提及,这对谷歌的未来非常重要。

      拜福德:谷歌还有其他项目,比如Google Brain。谷歌也在推出机器学习功能,比如Google Photos以及大批面向用户的东西。你发现自己与Google Brain互动了吗?是否存在重叠部分?

      哈萨比斯:当然,实际上我们是互补的,每周都会进行交流。Google Brain主要集中在深度学习方面,拥有杰夫·迪恩(Jeff Dean)等优秀工程师,为此他们已经扩散至公司的每个角落,这也是我们为何对Google Photos搜索取得如此大的进展感到惊讶的原因。此外,他们驻扎在山景城,距离产品团队更近,研究周期仅为12到18个月。而我们的算法开发周期更长,为此最初可能与产品没有太多交集。

      拜福德:谷歌对AlphaGo的支持有多重要,没有这种支持你们能取得成功吗?

      哈萨比斯:谷歌的支持非常重要,AlphaGo实际上还没有应用到硬件上,我们需要许多硬件训练它。我们还需要研发不同版本,让它们在云端互相对战。这可能需要大量硬件支持才能有效,因此如果没有谷歌提供的资源,我们无法短期内取得进展。

      6.机器人将来或许会帮助找到新粒子

      拜福德:谈到机器人,我曾去过日本,这个国家将自己视为机器人的“精神家园”。我看到机器人在日本主要有两种使用方式:Fanuc等公司制造的工业机器人,可以为固定目标做很多令人惊讶的事情。而软银开发的礼宾式机器人Pepper,在某些方面更具雄心,但使用有限。你对这种情况如何看待?

      哈萨比斯:我认为,正如你所说,Fanuc的机器人拥有很强的物理能力,但它们缺少智慧。礼宾式机器人有点儿像智能手机助手,但也仅是根据预编程对固定问题做出解答。如果你不按常理出牌,它们就会陷入混乱。

      拜福德:所以我想,显而易见的问题是,机器学习等技术将提高机器人能力。

      哈萨比斯:这只是完全不同的方法。你正在建立新的能力去学习新东西和处理意外事件,我认为你需要将机器人或软件应用到现实世界中,与真实用户互动,它们需要有这样的能力并正确使用。我认为学习路径最终必须是正确方式。

      拜福德:你认为学习型机器人最直接的应用是什么?

      DeepMind创始人接受专访:人工智能将塑造未来

      哈萨比斯:实际上,我们对此还没有太多考虑。显然,无人驾驶汽车也是一种机器人,但它们只是狭隘的人工智能,尽管它们利用了学习型人工智能的某些功能充当计算机视觉。特斯拉的计算机视觉技术也是基于深度学习开发的。我相信,日本的老年护理机器人、家用清洁机器人也是如此,我认为它们都将非常有用。特别是在人口老龄化时代,它将有助于缓解社会压力。

      拜福德:为什么学习型人工智能如此重要?

      哈萨比斯:你必须思考下:为何我们现在还没有这些东西?为何我们还没有能够自动清理房屋的机器人?原因是,每个房屋的布局、家居等各不相同。即使在你自己的房子中,其每天的状态也绝不一样,有时候会显得混乱不堪,有时候则十分整洁。因此你没法对机器人进行预编程,以方便其帮你整理房间。此外,还需要考虑到你的个人喜好,比如你喜欢如何叠衣服等。实际上这是个非常复杂的问题,人类做这些事很容易,但机器人处理却非常复杂。

      拜福德:你有机器人真空吸尘器吗?

      哈萨比斯:我有一个,但它不是非常管用。

      拜福德:我想知道我们何时能够获得更先进的机器人?足够好的机器人的临界点在何处?

      哈萨比斯:我认为每个人都可能购买定价合理的机器人,它可帮你清洗盘子和整理屋子。这些漂亮的真空吸尘器非常受欢迎,但它们还没有智力。因此,我认为每次改进都将促使更先进的机器人诞生。

      拜福德:你对人类、机器人以及人工智能将来的互动持何种愿景?

      哈萨比斯:我本人没有太多考虑过机器人的问题。但我对在科学中使用这种人工智能感到兴奋,它可以促使科学以更快步伐前进。我希望看到人工智能辅助科学,你可以有效地使用人工智能助手,帮你完成单调乏味的工作,寻找看起来有趣的文章,在大量数据中发现规律,帮助人类科学家更快取得突破等。我认为,如果将来人工智能可以参与到发现新粒子的研究中,那将非常酷。

编者按

戴密斯·哈萨比斯从4岁开始下象棋,很快成为天才少年。8岁时,在棋盘上的成功促使他开始思考两个至今令他困扰的问题:第一,人脑是如何学会完成复杂任务的?第二,电脑能否做到这一点?
16岁时,他进入剑桥大学计算机科学专业;
17岁时,他设计出游戏《主题公园》,是最早包含人工智能元素的游戏之一。
1998年,22岁的哈萨比斯成立电脑游戏公司“仙丹工作室”,加入商业界为自己“充电”。
2005年,哈萨比斯回归学术领域,在伦敦大学学院攻读认知神经科学博士学位,开创性地发现大脑中海马体与情景记忆间的关系。他的研究成果在2007年被顶级学术期刊《科学》评为“年度突破”。