AI中国网 https: //www.cnaiplus.com
3月27日消息,搜狗CEO王小川今日在在洪泰基金CEO春分大会上做了关于人工智能技术思考的分享。在开场,王小川首先调侃着澄清近日因搜狗即将上市而流出的关于自己恋爱时间的传闻,“我从来没说过搜狗不上市我不谈恋爱这种话”。
关于人工智能,他认为在往三个阶段走:1,将传统规则教给机器;2,将答案教给机器记忆学习;3,将目标给机器自我学习。而目前正处于第二阶段的高级阶段。同时,他也认为今年的人工智能还是有很多的局限性。比较难点的是在自然语言的处理,在翻译系统现在有大的发展,机器做翻译能把中文翻译成英文,英文翻译成中文,这个能翻译的很流畅,因为现在的机器人的学习,不是基于理论方法。(锡安)
以下内容根据王小川在现场分享整理:
简单讲,我们讲人工智能是往三个阶段走,我们还处在第二阶段的高级阶段,人工智能这个话题不是新课题,在上个世纪60年代、80年代就在做人工智能,那时候做人工智能的教授其实很不幸,那时候人工智能的水平是远远不够的,当时人们把对自己世界的认知变成了规则,转成了机器人,就是把这个规则告诉机器,这是那个时代的工作,那是60年代到80年代,人们对规则的表达是偏离这个目标的,就是做不好。
80年代基于统计方法来做的人工智能,不要尝试把人对于世界的认知告诉机器,就是让机器学,让你看答案是什么。一方面是把原始的问题,看到问题之后把答案给他,这是走上了让机器人学习的道路,这搞了几年。这个答案很清楚,很多经典案例的是人脸识别,怎么描述呢?胖一点的、瘦一点的等等,我知道这个人是谁,但是没有办法描述。到2000年之后的突破点,我们发现用更粗暴的方法,我们不要尝试在这个问题上找特征,把特征告诉机器,把原始的问题原始的数据交给机器,我给他更多的机器,我给他两千多张照片,让他自己去找特征,最后得出答案。2000年之后的爆发是跟这个相关的,阿尔法狗就是这么出来的,他不是靠原来的方法做的。
今天局部开始走到第三个阶段了,阿尔法狗属于是第二阶段加上一点点第三阶段,给它一些答案,给它每一个局面下人是怎么走的,让机器学,这样可以发现机器很难追上顶尖的人。到最后我告诉机器说,你走对,你赢了,或者是输了,这个也可以做了根据我看到的媒体报道。
在工业里面我们在第二个阶段,一定要用大数据。好处是我们不需要工程师对原有的行业有特别深度的理解,我举个例子,医生他是懂得怎么看心脏病的心电图,但是他很难把这个规则明晰的描述给工程师,从去年开始工程师得到很重要的体验,我不需要医生去学习他细节的技术经验,只要医生告诉我这个代表什么,工程师数据量大,就可以建立这样的模型,这跟选择人工智能的行业之间有天然的沟通鸿沟就消失掉了,这个很快就可以在人工智能里面得到突破的应用。未来的两三年里已经有成功工作经验得到了巨大的升级,今年在智能领域里面有一个很大的发现。
我今天就不讲了这个深度学习的意义和突破了,今年的人工智能还是有很多的局限性。核心问题是有一个前提的条件,要很安静的环境里,如果这个环境里还有背景音乐,同时两三个人一块说话,人是很清楚能分辨出来的,但是机器做不到,这个对机器而言,如果是声音里混了声音,人工智能是对见过声音的处理,如果两个人一起说话就不行了。一种做法是我们用麦克风做,我们在汽车里面,汽车里有胎噪和风噪,把这个录下来,然后在混到这个训练里面去,不是在识别里面做,而是他见过这样的声音。还有就是去噪音。
比较难点的是在自然语言的处理,在翻译系统现在有大的发展,机器做翻译能把中文翻译成英文,英文翻译成中文,这个能翻译的很流畅,因为现在的机器人的学习,不是基于理论方法。人如果流畅,机器也就可以流畅。
我去年6月份去了一个剑桥顶尖语言的实验室,他们在演示一个人机对话的系统,演示的非常清楚,我想吃辣的,我想吃什么样的,机器就帮你找。当我找到餐馆的时候机器问我问题,你需要停车位吗?我说我没有车,它就没有说的了,因为它不知道车和停车位是什么关系。语音图像里有大的发展,语言上现在是非常的不够。
另外一个很好的视角,跟投资相关的地方,我想看到人工智能的分类,像理解讲了一大堆的理论,但如果从产品上分类从功能上分类,我把人工智能分成这么三类。叫级别、判断和创造,创造叫生成。相信大家会看到一个语音能转化过来,或者是图像里面可以看到大象在做一个什么事情。今天做的第一个事情就是把物理世界的东西建模,语音识别、图象识别这都叫识别,像人脸识别,这是一类。还有是创造生成,语音的合成和图象合成是在这一类,所以一和三能干什么事呢?我们可以提升人机交互,就是在机器里可以看到这么一个东西,能把他合成出来做交互,相对而言就是在安防领域里面做人脸识别,在我心中这个东西有用,但是商业的价值不大。
AI中国网 https: //www.cnaiplus.com
本文网址: