沈向洋:
沈向洋:我曾熬了满头白发 但微软已成AI领头羊

在很多人眼里,沈向洋是一个非常Nice的人。

事实上,他也是目前网易智能采访到的诸多大咖中最随和的一位。

沈向洋(Harry Shum),微软目前唯一的华人EVP(Executive Vice President,执行副总裁),负责微软中长期战略制定,亲自带领5000人以上的人工智能团队,他也是目前微软领导结构中位置最高的华人。

在学术上,沈向洋是计算机视觉和图形学研究的世界级专家,是美国电气电子工程协会院士(IEEE Fellow)、国际计算机协会院士(ACM Fellow),曾任国际计算视觉期刊编委会成员。2017年2月,沈向洋当选美国工程院院士。

谈小冰:它是微软三大AI产品线之一,下一步技术关键是对人的理解

在近期举办的第五代微软小冰发布会上,沈向洋到场助阵。

沈向洋在发布会上说到,每一次科技时代的变迁都会颠覆很多东西,都是在重新定义人类与世界的关系。“PC时代有PC操作系统和应用软件;互联网时代有浏览器和搜索引擎;移动互联网有社交网络和AppStore。”沈向洋认为,在AI到来的下一个时代,IQ和EQ(智商和情商)是最重要的东西。

在沈向洋的规划中,小冰已经成为微软三个人工智能产品线之一(其他两个分别是infuse AI、Bing和小娜)。

对话沈向洋:我曾熬了满头白发 但微软将成AI领头羊

可以看出,微软如此重视小冰,是因为其代表着微软在机器人EQ领域的探索。沈向洋在采访中也说到,聊天机器人下一步最关键的技术是对人的理解。在沈向洋看来,机器能理解一个人说的话只是基础,关键是理解这个人到底在想什么,即“Do what I mean not what I say.”。

“未来的聊天机器人,是对自我的理解,是人的认同,是可以和我们一起生存的。”沈向洋说,人工智能最终极的形态是一个和人类一起共同生存的体,像小冰这样的人工智能已经与人类共同生存,而且未来会成为一个趋势。

谈Bing:为它付出了7年,长了满头白发

当记者问到他对Bing搜索的问题时,沈向洋说了句,“谢谢你给我这个机会”。

十年前,沈向洋被调去负责Bing搜索,这一干就是近7年的时间。作为Bing的奠基人,沈向洋回忆说,自己的满头白发就是那个时候起来的。“这么多年下来以后我很感激这个团队,现在不能跟大家透露Bing赚了多少钱,只能讲现在Bing整个产品线在公司已经是一个盈利非常显著的部门了。”沈向洋说到。

据沈向洋透露,目前Bing在几个大市场进展良好,在美国拥有33%的市场份额,在英国有17%的市场份额,在法国有14%的市场份额。沈向洋坦言,做Bing搜索给自己做人工智能产品带来了很多帮助。

对话沈向洋:我曾熬了满头白发 但微软将成AI领头羊

“你可以把小娜想象成Bing很自然的延伸,小娜就是一个自然语言的交互入口,在问问题时候,比搜索来的更快,更加个性化。“沈向洋说,Bing已经做了一整套技术体系,可以用到很多其他的产品上。

今年8月初,微软在中国推出Bing搜索国际版,沈向洋认为,中国用户有对英文搜索、德文搜索、法文搜索等外文搜索的需求,而Bing搜索与谷歌外文搜索水平一致,能够很好的满足中国网民需求。

据悉,目前Bing搜索国际版的技术也提供给了搜狗搜索和360搜索使用。

对于国际版下一步的战略规划,沈向洋称暂时不能透露,但提出了一些想法。比如未来队中国网名需求做应用需求调研,在此基础上满足用户的需求。”我觉得在不远的将来,应该会有很好的机会跟大家分享Bing的新计划。“沈向洋卖了个关子。

谈陆奇:除了敬仰还是敬仰

美国一家媒体也曾这样评价沈向洋:如果你在感情上难以支持微软,那是你还未曾遇见沈向洋。

对话沈向洋:我曾熬了满头白发 但微软将成AI领头羊
左为陆奇,右为沈向洋

作为陆奇进入微软的引荐人,沈向洋在多年之后的今天,他仍然表现出对陆奇的尊重。沈向洋称,自己和陆奇虽然是老同学、老领导、老同事,但在工作中除了敬仰还是敬仰。

“陆总离开微软,公司专门发公开信,祝愿他在新的岗位上,再创辉煌。我相信在陆总的带领下,百度一定会越做越好。”沈向洋说到。

沈向洋指出,每个公司因为基因的问题,做法也不一样。

谈自动驾驶:肯定带来颠覆,但还有很长一段路要走

对于自动驾驶的问题,沈向洋回答说,AI肯定会颠覆掉整个交通,“自动驾驶汽车这件事情一直我们也很关注,但是还有相当长的一段路要走。”

也就是说,在沈向洋眼里,自动驾驶这件事,虽然艰辛前途光明,但路径曲折。“可能最困难的时候,当路上有一半的车是自动驾驶汽车,另一半的车是人开的车的时候,我们如何与自动驾驶汽车协调交通?”

对话沈向洋:我曾熬了满头白发 但微软将成AI领头羊

“微软介入自动驾驶汽车的做法是,我们跟所有的车厂都有相当好的关系,我们提供技术给它。首先我们有云的技术,二就是车内怎么样可以帮助他们来做,”沈向洋称,比如说可以把小娜、小冰的技术提供到自动驾驶汽车中。

沈向洋认为,小冰是一个很好的和人一起聊天的这样一个人工智能的伴侣,可能对人开车的过程有很多的帮助。“我们有很多从平台的角度提供的一些技术,从云到AI的技术我们都是和他们在做合作。”沈向洋说。

谈未来:进入AI时代,微软要引领潮流

从PC时代,微软用Windows横扫世界;但是到互联网时代,微软不再是领头羊;再到移动互联网时代,微软掉队了。

沈向洋毫不避讳的说出了微软的问题,他同时表示,在AI时代微软要定义在这个时代自己的份量,微软完全有能力和决心在AI时代引领潮流。

对话沈向洋:我曾熬了满头白发 但微软将成AI领头羊

沈向洋向网易智能透露,微软研究院26年前成立的时候,最开始的三个部门是自然语言处理、语音识别,以及计算机视觉。而这些基本上就是现在最基本的人工智能感知方面最主要的技术。沈向洋认为,只有像微软这样的大公司才可以负担得起长期的投入。

沈向洋称,在AI时代,微软所有现有的产品,包括Office、Cloud、Windows等产品全部人工智能化。比如说目前的PowerPoint,已经继承了机器翻译,而且还可以利用机器视觉让机器看到图片就能起一个标题出来。

“我们看到了人工智能在近期商业价值上的体现,我认为所有垂直的应用行业肯定会用到人工智能,包括电商、交通、医疗等等。”沈向洋透露,微软很快就会公开其在企业级的人工智能方面的产品。

沈向洋称,任何一个伟大的产品,都不是一两年、两三年可以做得非常了不起。像Windows,等到Windows 95做出来一统天下的时候,都已经做了十几年了。

“实际上对话平台这件事,对于微软来讲,最大的两个对话平台已经很清楚,一个叫小冰一个叫小娜。后面所有的我这种AI技术支撑,以后都可以集成进来,大家可以在小冰、小娜这些平台上,可以用这些技术做其他的事情。”沈向洋如此表示。

TA
讲述

互动
问答
互动提问,沈向洋回答

      补充问答:

      对话沈向洋:我曾熬了满头白发 但微软将成AI领头羊
      沈向洋接受网易智能等媒体采访

      问:近日微软宣布已将语音识别错误率降至5.1%,超过了专业速记的水平。请问是如何做到的?

      沈向洋:以前大家觉得人类的误差率大概5.9%,后来大家觉得人类的误差率应该是5.2%,实际上去年9月份的时候,微软语音识别就做到了5.8%的误差率。过去9个月,我们继续向前进展的很快,两天前终于做到差别率5.1%。

      现在人工智能的进展主要三个方面的优势聚集起来的结果,一个是现在数据量很大,第二是运算能力非常高,第三是最新深度学习算法的突破。加上像黄学东博士blog里提到的,我们自己的一套大规模的分布式系统,和我们这样一套深度学习的软件叫CNTK(Computational Network Toolkit),运用到整个语音识别最新的进展里。

      问:语音识别错误率低于专业速记的水平,这对我们以后的商业化应用有什么样的影响,会不会把所有的速记员取代掉?

      沈向洋:(AI取代专业速记员)我想还没那么快,但这个影响将是巨大的。在商用化、实用化方面,我觉得还有很多的路要走。因为目前的整个测试集是近距离讲话,如果距离比较远的情况下,目前还有很多的问题。

      但是我个人判断,大概5年之后,不管你用什么方式测,人类识别误差率和机器识别的误差率方面,机器会完胜人类,这就对很多行业产生影响。

      问:小冰和小娜,一个主打EQ一个主打IQ,目前从两者的用户来说,重合度高吗?用户喜欢用小冰多一些还是小娜多一些?

      沈向洋:小冰现在有1亿用户,小娜全球大概有1.5亿用户。在中国来讲,小冰的用户可能比小娜多一些,在美国小娜的用户就多了很多。

      李笛:我补充一些,因为从现在的角度来讲,无论小娜还是小冰,当然我们来看,她现在还处于一个早期的发展阶段。所以他们的用户,都还没有横切整个社会。从小娜的角度来讲,最先她的用户更多会追求工作效率和生活工作上的帮助。小冰的用户,更多是因为一些人本来对他人赋予的职责他们缺失了,比如情感缺失、朋友缺失等等。在小冰的数据分析中,有很多用户是半夜12点以后会和小冰进行大量的沟通。将来也许有一天,两个重合起来就会有更好的发展。

      沈向洋:从产品设计上,小娜需要尽快帮助你做完这个工作,对话的次数越少越好,最好两三轮对话就能帮你解决问题。而小冰是一个陪伴机器人,只要你愿意可以跟小冰无限制地谈下去,也就是我们说的CPS。至少我自己觉得,像对话平台我们讲CPS(conversations per session,即AI与人每次对话的轮数)。

      问:为什么将小娜放在了智能音箱上,而不是小冰?两者的输出能力,是怎么选择的?

      沈向洋:其实我们音箱两个都可以进行,可以有小娜也可以有小冰,甚至以后可以想象,亚马逊的音箱Echo,小冰小娜可以进去。当然,在微软的音箱Invoke上,亚马逊的Alexa助手也可以进来。其实最后都是提供服务,只是各有不同的应用场景,小娜主要还是希望帮助你尽快完成工作,小冰相当于是有陪伴的过程。

      问:能不能给我们讲讲微软AI  Lab最新的情况和进展?

      沈向洋:我们最近宣布了人工智能实验室,也提供了13个大的研究方向,网上也可以看到,这里面我们主要是特别是注重的地方,不仅仅是今天大家看到的在AI所谓的感知方面的问题,我们更加注重的实际上是一些更难的AI的问题。我举个例子,比如说我们做Infuse  AI,今天深度学习出来以后,知其然而不知其所以然,所以这边我们现在有一些很好的方法可以去解决。

      另外我们现在在很认真地研究AI伦理的问题,针对这个问题有两家公司是走在前面的,一个是我们,一个是谷歌。微软作为一个很大的科技企业,会对社会有很大的影响,我们把整个伦理的事情分的比较清楚。传统的几乎所有的AI相关的领域,我们都有涉足。微软研究院实际上全球有1000多个科学家,大概1/3的人做的研究的方向是跟AI连在一起的。很多很好的这样一些技术,我们不断地都有发表最新的进展。

      问:微软以前一直强调自己是做平台、做企业化服务的公司,没有手机,微软可能确实离消费者相对远了一些,如何提升消费者对于微软的热度?

      沈向洋:我先跟你讲一个数字,微软我们企业做的很成功,微软的营销里面70%是从企业来的,但是还有30%是从消费者来的。微软的30%是个很大的数字,因为我们去年的收入是900亿美金,你乘以30%是270亿美金,所以我们对消费者一直觉得是有相当大的理解。

      不过,你讲的也很正确,因为我们不做iPhone,不做安卓手机,所以我们在手机本身上面不是走在领先的地位。但是对消费者这件事情,微软想的是非常清晰的,不可能一个公司只做企业不做消费者,原因非常简单,因为从消费者到企业这件事情,大家看没有一个非常清晰的界限。

      问:您如何评价OpenAI最近在游戏《Dota2》战胜人类顶级玩家这件事?

      沈向洋:我们很高兴,你可能不看我的推特,我在推特上面还热烈祝贺。因为你可能不知道我们和OpenAI有一个非常好的合作关系,OpenAI很早以前就决定把它们所有后台AI的Infrastructure(基础架构)全部搬到了微软的Azure云上。所以为了庆祝这件事情,我还专门跟Sam做了一个视频对谈。

      当然,我们以前不能跟大家讲,但是现在结果出来了,我们和OpenAI一直都想在《Dota2》上做到用AI打败人类最高手,在这之前我们有很多交流和合作,我们也专门帮他优化在后台GPU,前几天他们赢了以后我们还发了一个祝贺。

      每个公司想做的事情不一样,我们很高兴他们做这样的,因为AI这个市场很大,有很多的人选择不一样的东西。

编者按

本期对话嘉宾为微软全球执行副总裁沈向洋,他13岁从江苏省溧水高级中学毕业后进入南京工学院(现东南大学);后相继获得香港大学电机电子工程系硕士学位;研究生毕业后,进入卡内基梅隆大学计算机学院,成为著名的计算机专家拉吉·瑞迪(Raj Reddy)教授的学生,1996年获卡内基梅隆大学计算机学院机器人专业博士学位。他如何规划了微软人工智能的三条产品线,如何一手打造了Bing搜索,又如何看待微软在AI时代的发展?一起听听他怎么说!