AI中国网 https: //www.cnaiplus.com
编者按:此文是根据中科院自动化所博士、北京盛开互动科技有限公司CEO曾祥永于2019年5月在浙江宁波余姚举行的第六届中国机器人峰会上的《智能机器人的多模态交互》报告录音整理摘编部分而成,题目为编者所加。
自然人机交互是智能技术的使命需求
马云曾在一次演讲中说:“人类正从IT时代走向DT时代。”随着新一代信息技术、大数据和人工智能等技术的发展,以及虚拟现实、增强现实以及混合现实等技术的融合,智能机器人在各个领域的应用愈加广泛,RT时代(机器人技术Robot Technology)也随之到来。
处于信息技术与数字技术兼容的时代中,个人计算机不断普及,人与计算机的交互越来越受强调。曾祥永认为,机器人作为人机交互与人工智能技术的重要载体之一,已经进入到生产、生活、学习、工作和娱乐的方方面面,但目前各类机器人的形态很不一样,大家无法用一个固化的形态来定义机器人,现实中部分厂商发布的智能产品是很多种技术应用的变种。
研究或应用智能技术的核心目的是什么呢?曾祥永指出,智能技术的应用本质上是为了极大程度释放人类的体力与脑力,让它有人的行为思考,这是终极目标。而释放人类体力则需要通过一种自然的交互方式,因此,自然人机交互是智能技术的使命需求。
实现自然人机交互的关键是理解意图与情感
曾祥永以车内自然交互为例,认为汽车内部需要能够自然交互的智能空间,即使以后全自动驾驶,汽车依然是个人的空间,这个空间可能会变成人休息、学习、工作的空间,在这个过程中依然存在对周边环境的自然交互。无论智能技术如何发展,它对人产生界面的形式就是自然的,或者说是对等的。智能人机交互如何去实现呢?曾祥永表示其需要类人的思考或行为能力。既然是类人,就要有对等的考虑。
人类是真正具有感知能力、认知能力及执行系统的生物体,是拥有最高智能的生物体,若要对等的话,机器人要具有对应的响应、输出或思考的能力。从计算机的角度来讲,实际上它需要有输入、输出接口的智能系统。此外,或许还有跳过外在输入接口、直接通过人脑接口触达机器人智能系统的方式,曾祥永认为这是当下大家正在研究和应用的方向。如果要真正实现自然人机交互,就要把机器当做人来进行考量,因此,关键在于机器人能够理解人的意图与情感。
多模态融合是智能交互发展的必然趋势
那么,人与机器的交互如何才能更舒适、自然,并且使信息的分发更加高效呢?曾祥永指出,多模态融合是智能交互发展的必然趋势,其中包括多模态特征层融合与多模态决策层融合。他认为,在5G的影响下,机器人本体一定还要具备传感与执行、较强的本地学习与记忆的能力,所以机器人需要不断进行智能升级,通过很强的云端,N个机器人之间共享智能大脑。
机器人不仅只需要学习能力,还需要储存很多内容与应用。曾祥永表示只有内容和应用才是用户真正需要的,或是说执行能力是真正需要,因此,机器人在本体上或云端都需要有更强的规模。曾祥永还列举贤二机器僧等多模态融合智能交互技术研发与应用的实践,展示了其为数十家智能硬件、智能机器人提供视觉识别与智能交互的方案。虽然成果颇丰,但曾祥永仍认为实现智能人机交互是任重道远的事,期待未来20年真正实现人和计算机之间自然、对等的交互。
AI中国网 https: //www.cnaiplus.com
本文网址: