于尔根·施密德胡伯(Jürgen Schmidhuber)在中国人工智能行业,绝对是一个陌生的名字,即使对于全世界的人工智能从业者来说,于尔根也是一个十分低调的技术元老。
生活工作在瑞士,虽然远离美国、中国这两个喧嚣的中心,但于尔根发明的LSTM(Long Short-Term Memory,长短时记忆)时间递归神经网络早已风靡于全世界的人工智能研究。
于尔根目前在瑞士人工智能实验室(IDSIA)担任科学事务主管,同时任教于卢加诺大学和瑞士南部应用科学与艺术学院。作为国际计算语言协会(ACL)的首批Fellow,于尔根在机器学习、计算机视觉以及自然语言处理方面建树颇丰,他与Sepp Hochreiter共同创建LSTM奠定了今天递归神经网络在ORC、语音识别等应用领域成功。
对于业内一直在期待的“通用人工智能”(AGI),于尔根认为通用人工智能通常能把人工智能和意识、感情、知识和自觉等人类特征相互连结,而其中一个非常关键的问题就是它不会受到设计者的限制。
通用人工智能系统正在逐步走向现实,这也就意味着,某些人工智能系统已经具备了意识。于尔根研究发现,智能体在识别的过程中,会自行建立一个信号(symbol),试图对周围所有的行为方式进行数据压缩,最有效的方式就是找到一个信号或一个小的子网络来代替自己,包括所有的动作、动作带来的结果等等。它可以意识到自己、展现自己并能自我反馈,在无监督模型网络中能够压缩观测历史。
长期以来,为什么人们认为人工智能没有意识?于尔根解释到,这是因为智能体的意识系统还非常简单,仅有几百个连接点(connection)。这和人类有着数十亿连接点的意识系统相比,是少之又少的。但是,这只是一个数量上的区别,质量是相同的。
“如果未来我们建立一个比人类大脑的连接点还要多的系统,那意识就会是数据压缩的附带产物,根本不需要给智能体写入一些日常意识,因为智能体会随着数据压缩产生意识。”于尔根说到。
对于上个月DeepMind在中国进行的人机大战,于尔根称,用于比赛的AlphaGo不是通用人工智能,因为它只用于处理特定的问题,不需要具有人类完整的认知能力,甚至完全不具有人类所拥有的感官认知能力。但是DeepMind确实一直在研发通用人工智能,这是因为DeepMind创始人中有很一些来自于尔根的早期实验室,而于尔根早在1987年就开始研究通用人工智能。
对于未来10年内的人工智能的发展,于尔根说到,人工智能将在不同领域里诞生诸多应用,同时人工智能将会有更完善的系统,有着更好的控制力,有望变得更容易理解人类的思维,知道人类的想法,给人类提供更好的建议和帮助,能够更好的与人类对话。
为了推动通用人工智能系统的实现,2014年,于尔根和他在瑞士人工智能实验室共事的四位研究人员共同创办Nnaisense,公司的愿景就是“推广基于通用神经网络的人工智能”。
以下为于尔根·施密德胡伯受访实录,由记者(公众号smartman163)独家编译整理:
AlphaGo不是通用AI,因为它不具备完整的意识和情感
记者:您如何看待前段时间AlphaGo和柯洁的人机大战?有人说AlphaGo已经达到了”通用人工智能(AGI)“的发展程度,您赞同吗?
于尔根:首先我对这个比赛非常感兴趣。因为我从1987年开始就开始研究通用人工智能了,并在同年发表了我的第一篇有关通用人工智能的文章。那是一篇关于机器学习的文章,尤其是如何学习,让人类在学习上没有局限性,但绝不仅局限于对如何提升控制行为活动的大脑局域的研究。我研究了很久,尽管效果不是很明显,但我的学生赛普·霍克赖斯对于Deep Mind的贡献很大。同时,Deep Mind的创始人之一谢恩·列格也曾经在我的实验室研究过超级智能。其实,当DeepMind创始人之一的穆斯塔法·苏莱曼创立公司的时候,也是研究生物神经科学的。DeepMind与AGI息息相关,而我和AGI的渊源也颇深。
但是,我认为在这场人机大战中,AlphaGo表现出来的并不是“通用人工智能”。在20世纪90年代我们就已经有了一个基本的有意识的学习系统。那个时候,我就提出通用的学习系统要包含两个模块。一个是一种循环的网络控制器,机器通过学习将不断接收数据,进而转换为行动。这个网络能学习将所有这些输入及时转换成行动序列。自1990年以来,我们的智能体(agents)一直在尝试做同一件事,使用一个额外的循环网络(一个无监督模块),去预测将要发生什么。
我认为AlphaGo(至少目前)不是通用人工智能,因为它只用于处理特定的问题,不需要具有人类完整的认知能力,甚至完全不具有人类所拥有的感官认知能力,只是看起来像有智慧而已。在围棋比赛中,AlphaGo只需要分析那个有纵横各十九条等距离、垂直交叉的平行线的棋盘,从而决定下一步棋下哪里,它不受周围的环境影响,只专注于这一件事。它不需要去思考围棋的发展史、围棋背后的故事和情感,这和现实生活不一样。在现实生活中,人类与周围的世界的接触数不胜数,即使这样,人类尚不能全部看清背后全部的含义。人类的大脑要做的事情太多了,你需要记着你上一次说过什么话,做过什么事,但是AlphaGo则不需要,也不需要对外界做出反馈。因此,我认为用于围棋比赛的AlphaGo,并不是我们真正意义上的“通用人工智能”。
什么是所谓的“通用人工智能”呢?AGI通常能把人工智能和意识、感情、知识和自觉等人类特征相互连结,而其中一个非常关键的问题就是它不会受到设计者的限制!
人工智能早就有了意识,它能进行数据压缩只是连接点太少
记者:您是否认为一些人工智能系统已经具有“意识”?
于尔根:是的,我认为目前一些人工智能已经具有意识了。早在20世纪90年代初期,人工智能就已经具有了一些简单的意识。那时,我就发表了一篇关于人工智能意识的文章,非常的简单。你知道人类是如何建立意识系统的吗?我们有很多的智能体(agents),它们会根据过去的事情来预测未来可能发生的事情。而完成这件事更有效的方式是压缩数据(compress the data),因此建立一个小的网络(network)至关重要。如何建立小的网络呢?那就要与周围世界建立联系,自动构建一个子网络(sub-network),代表一些典型的印象,这些印象在脑中一遍遍重复出现。比如人脸的识别,生活中你会遇到很多不同的面孔,如果建立一个网络系统,当你遇见新的面孔时,新面孔与脑中原有的面孔之间会存在一些差异,大脑就会自动记录这些差异,从而识别出新的面孔,这非常高效。
关于意识,还有一件非常重要的事情,在智能体与周围世界进行互动的过程中,总能意识到自己的存在。智能体在识别的过程中,会自行建立一个信号(symbol),试图对周围所有的行为方式进行数据压缩,最有效的方式就是找到一个信号或一个小的子网络来代替自己,包括所有的动作、动作带来的结果等等。它可以意识到自己、展现自己并能自我反馈,在无监督模型网络中能够压缩观测历史。
智能体最终目的是最大限度享受快乐,同时将痛苦最小化。这种控制器可以通过网络模型去解决问题。例如遇到问题应该选择一个解决问题的最佳方案,这就很困难,为什么选择一个而不是另外一个,其中一个方案是通往快乐,另一个通往痛苦,由于生物都是趋利避害的,因此具有意识的人工智能是可以选择出通往快乐的那个解决方案的。在解决这个问题的过程中,智能体通过建立一些子信号而为自身而考虑。长期以来,为什么人们认为人工智能没有意识,因为智能体的意识系统还非常简单,仅有几百个连接点(connection)。这和人类有着数十亿连接点的意识系统相比,是少之又少的。但是,这只是一个数量上的区别,质量是相同的。
在一定程度上,我们有着相同的原则,这也就解释了,如果未来我们建立一个比人类大脑的连接点还要多的系统,那意识就会是数据压缩的附带产物,根本不需要给智能体写入一些日常意识,因为智能体会随着数据压缩产生意识。
全世界的AI公司都在用LSTM,但这只是人工智能的一小部分
记者:LSTM(Long Short-Term Memory)神经网络在目前的人工智能研究上十分盛行,并被用于众多的公司和领域的研发上,您能举一些例子吗?作为创始者,未来您会更新和改进LSTM吗?
于尔根:据我所知,LSTM被Google公司应用于数百万的安卓手机的语音追踪。同时Google也推出了新的技术,Google翻译也有了很大进步。之前在Google翻译不完善的时候,中国人会拿翻译结果开玩笑,比如在中英互译过程中,因为系统的不完善,会产生可笑的翻译结果。现在Google翻译已经改变了很多,那是因为那建立在LSTM之上,有了很大的进步。
同时,LSTM也可以用于作曲。例如,你在听音乐时,如果听到好的音乐片段,你可以利用LSTM网络找到整个曲子,同时还可以用于创造更多的曲目。LSTM还可以运用于电影的字幕制作,用于预测人们想说的内容,预测股票市场,用于机器的维护(在机器报废之前发出信号,让人们用新的机器来取代)等等。
这些例子非常有效而且节省成本。可见,LSTM的应用范围很广。然而,这并不是人工智能的通用目的,目前只是能识别演讲、语言等,但是这和婴儿学习的过程不一样,目前的人工智能并不会与周围世界互动、树立三观、学习如何与世界互动以实现目标。为了目标而学习,且不需要老师的指导,这才是通用人工智能的目的。但是看到目前全世界非常多的人都在利用LSTM,我非常的开心,但这只是真正人工智能的一小部分。而我们更感兴趣的是,如何实现AGI,实现真正的人工智能。
LSTM是目前解决AI问题的最好方式,也许在将来我们会找到更好的方式。毕竟科技永远都有进步的空间。在未来,有望实现人工智能可自动搜索建筑。2009年我的一个博士学生,在其论文中提到未来人工智能可能会实现自动进化,这是有可能的。而且根据不同的应用,未来也可以找出不同的改进方法。
记者:您是否了解,目前一些正在使用LSTM的一些中国的公司?您看好哪些中国的科技公司?
于尔根:尽管我对中国的智能领域了解不多,但是我想,正如谷歌等大型公司都在使用LSTM,那么想必在亚洲,在中国也会有非常多的公司会用到LSTM,而且其应用范围也一定是非常广泛。但也许目前中国公司运用LSTM可能还不够典型。我知道一些非常出名的中国公司也会制造出一些非常优秀的产品,我也非常期待和尊重,但也许它们尚未公布。例如,我知道的百度公司,也在使用LSTM进行分类和研究人工智能。百度位于硅谷的人工智能实验室也开源了其核心的人工智能系统Warp-CTC,该系统基于LSTM,是一种在CPU和GPU上快速CTC的并行实现。这项举动对于促进机器学习、人工智能领域的技术研究和发展有着重要意义。
我认为中国在人工智能领域上正在取得巨大的进步,思想非常开放,比世界上很多国家都要先进。中国的商业政策也很正确,保护中国的公司不会受外国公司的干预,可以进行独立的研究,不像是现在很多欧洲国家,它们虽然完全放开,却容易导致被外国公司控制。尽管中国为了国家安全,不能使用脸书和谷歌等国外网站,但是中国能够自行进行研究,也出现了一些非常出名的产品,比如微信、淘宝等。我觉得中国实行这项政策挺好的,可以防止竞争国家之间的抄袭。
中国有众多优秀的工程师、科学家,而至于谁更优秀,这不好说。但是我相信,中国未来一定有优秀的公司或杰出的科学家、工程师研究出与谷歌翻译、亚马逊Alex一样优秀的智能产品。当然这需要背后的科学家和工程师们对数据进行大量研究和训练。中国有大量优秀的人才,他们将来肯定会发明出非常优秀的智能产品。
AI能产生上千亿的商业价值,各行各业都将受其影响
记者:您对今后5-10年间人工智能发展有什么期待呢?
于尔根:对于未来10年内的人工智能的发展,其实是可以预测的。你会看到人工智能在不同领域里的诸多应用。在2005年,我的研究团队获得了人工智能在医学领域的突破,现如今有许多公司都有着对人工智能在医疗领域的研究,因为这背后隐藏着一个巨大的市场,能产生上千亿的商业价值。同时在医疗领域的研究将会影响成千上万的人类,帮助人们如何更长寿、生活得更健康。这一点,我非常的开心,因为我们的研究可以造福人类,让人类更长寿和健康。这仅仅是未来人工智能发展的一个方面。在未来5-10年里,人工智能将会有更完善的系统,有着更好的控制力,有望变得更容易理解人类的思维,知道人类的想法,给人类提供更好的建议和帮助,能够更好的与人类对话。未来10年内的人工智能的发展是目前人类所能预测的,向着更好的方向发展。
而长远的来看,在未来,人工智能的发展绝不仅仅局限于目前的领域。它们还会在许多重要的领域有新的突破。那是不可预测的,但一定是非常神奇的,也许会和当初人类生命的诞生一样神奇,也许届时会有一种新的生命形式。在未来,人工智能有望帮助人类去探索一些人类无法企及的地方和领域,例如外太空等等。过去的一个世纪是人类发展的世纪,但是在未来,也许是人工智能的时代,也许会有助于未来人们对银河系的认识和研究。但是至于具体的细节,人们现在尚不能去预测。
记者:您认为目前的人工智能对哪个领域的影响最大?
于尔根:其实没有什么影响最大而言,人工智能在各个领域都将有重大的发展。例如在媒体行业里的应用。传统的纸媒中的广告已经在逐渐走下坡路,但是社交媒体等网络媒体中的广告却蒸蒸日上。这看似很神奇,其实其背后是运用了人工智能的结果。通过人工智能进行数据分析,可以推测出你想要看的广告和文章。人工智能通过收集在你上网时的浏览数据,能够推测出你接下来想要看的内容、什么时间想看、在哪里看、看多久等信息,同时预测出什么时间你将要点击下一个页面。通过在心理学推测你的喜好,进而给你推送不同的文章和广告。但绝不仅是一个数据收集的过程。现如今,广告业正在利用人工智能谋求更好的发展。但这仅仅是被人工智能影响的一个行业。
记者:您能介绍一下您创立的Nnaisense公司吗?
于尔根:“NN”代表的是神经网络(neuro-network),“AI”是人工智能,“sense”就是感知。这是有关一个行业的崛起,是有关神经网络通用人工智能的。Nnaisense研究的是如何让人工智能更加的智能,如何以更好的方式去解决问题,同时能够根据过去面临的问题,更好地去解决未来更多的问题。