来源:中国人工智能学会CAAI2019-11-22 21:04:00 热度:

吴奖获奖人物丨黄民烈:第九届吴文俊人工智能科技进步奖一等奖获奖者、清华大学副教授

LX A i 中 国 网 Q

原标题:吴奖获奖人物丨黄民烈:第九届吴文俊人工智能科技进步奖一等奖获奖者、清华大学副教授

九年磨一剑,AI先锋齐聚一试锋芒。11月29日—12月1日, 由中国人工智能学会主办的“第九届吴文俊人工智能科学技术奖颁奖典礼暨2019中国人工智能产业年会”将在苏州隆重举办。届时,学会将对81个成果授奖。

伴随智能科技的不断深化,人工智能正在全球范围内蓬勃兴起,大批AI科技先锋不断涌现,他们以优质的科技成果大力推动了人工智能的发展。自2011年学会设立“吴文俊人工智能科学技术奖”以来,该奖项已成为我国表彰鼓励科技从业者及企业的至高荣誉殿堂。

为全面实施创新驱动发展战略,贯彻落实国家《新一代人工智能发展规划》,通过推荐评选优秀的智能科学技术成果,切实调动广大智能科技工作者的积极性和创造性,表彰获得2019年度吴文俊人工智能科学技术奖的学者与专家,促进人工智能技术在各行业领域赋能,大力提升我国智能科学技术创新与产业化发展水平,加快建设成为世界人工智能创新中心和应用高地,中国人工智能学会将于 2019年11月29日—12月1日在苏州隆重举办“第九届吴文俊人工智能科学技术奖颁奖典礼暨2019中国人工智能产业年会”。诚邀您莅临本届颁奖大会,共襄盛举。

黄民烈,清华大学计算机科学与技术系副教授,主要研究语言理解、语言生成、语言匹配与推理中的科学问题,致力于解决对话系统、自动问答、阅读理解中具有挑战性的人工智能问题。2019年黄民烈教授及其团队与阿里巴巴语音AI助手阿里小蜜联合获得吴文俊人工智能科技进步奖一等奖。

获奖人物介绍

黄民烈博士,清华大学计算机科学与技术系副教授,智能技术与系统实验室副主任。他的研究兴趣包括强化学习、深度学习、自然语言处理等,尤其是对话系统,阅读理解和情感分析。在国际顶级会议和期刊(ACL、EMNLP、AAAI、IJCAI、WWW、SIGIR等)上发表了60多篇论文,入选ACL 2019最佳演示论文候选,获得IJCAI 2018杰出论文奖,CCL 2018最佳演示奖,NLPCC 2015最佳论文奖,2018年汉王青年创新奖(中文信息处理学会),2019年MSRA合作研究奖, 2019年获得吴文俊人工智能科技进步奖一等奖(排名第一)。情感对话模型的工作被麻省理工技术评论、英国卫报、参考消息、新华社等媒体广泛报道,常识对话模型的工作获得人工智能顶级会议IJCAI 2018杰出论文。担任TNNLS编委(2020年起),TACL的常务编审,ACL 2020/2016、EMNLP 2019/2014/2011的领域主席,AAAI 2017-2020和IJCAI 2017-2020的高级程序委员以及TASLP、TKDE、TOIS、TPAMI等国际顶级期刊审稿人。2019年获得国家自然科学基金重点项目资助。以下内容为黄民烈副教授的专访报道。

实验室及团队介绍

本次获奖的项目成果是由我所在的实验室团队和阿里小蜜团队共同合作完成的。

我所在的实验室名叫“语言交互式人工智能”实验室,隶属于清华大学人工智能研究院,计算机系智能技术与系统实验室。课题组由朱小燕老师和我领导,我们组主要从事深度学习、机器学习以及自然语言处理领域的应用基础研究,重点集中在通过对话交互体现的智能行为与智能系统,包括泛问答系统、任务或目标型对话系统、开放领域对话系统等。近些年我们在国际顶级会议或期刊上发表论文超过100篇,并且多次获得顶级会议的最佳论文或候选,比如ACL、IJCAI、KDD、COLING等。由于研究方向比较靠近应用,我们与谷歌、微软、惠普、三星、斯伦贝谢、阿里巴巴、搜狗、美团、腾讯等都建立了合作关系。

我们团队和阿里小蜜团队有深厚的合作基础。阿里小蜜团队主要从事人机交互和智能客服系统的研发和应用,他们所开发的“店小蜜”、“云小蜜”、“热线小蜜”等智能产品,覆盖了汉语、英语、俄语、西班牙语等11种语言,为全球数亿消费者提供服务。小蜜团队有着很强的科研实力,我们合作发表过很多国际顶会论文,并且多次获得过国际竞赛的冠军。我们共同开发的技术显著地改进了阿里小蜜线上系统的性能,也创造了显著的经济效益。

研究成果

我们团队的主要研究成果集中在人机对话领域。该成果提出了适用于文本处理的信息度量新理论,包括五十多篇顶会论文,在对话理解、情感理解、对话生成等人机对话核心技术上取得较大进展,有效提升了服务机器人的对话能力及服务效率。

理论创新

在理论创新方面,我们建立了自然语言处理中的信息度量理论,包括条件信息距离理论、短语非合成性度量、多对象信息距离度量等,这些成果不仅具有很强的理论创新性,而且实际应用效果突出。我们的论文也获得COLING 2010最佳论文奖、ACL 2012最佳学生论文奖,并且多次在国际测评中获奖。

技术突破

我们团队在人机对话关键技术上也取得了一定成果,包括对话理解、情感理解和对话生成等关键技术的创新。对话理解方面,我们提出了字符串重写匹配模型和高效语义匹配模型;在情感理解方面我们取得了系列成果,我们提出了第一个属性嵌入的细粒度情感分类模型,不到3年时间引用400多次。特别是对话生成技术,我们团队首次提出常识感知对话生成模型,这一工作获得了IJCAI 2018杰出论文奖。

我们首次提出情绪对话生成模型,使得对话机器人具有表达喜怒哀乐的能力,在对话研究领域开辟了一个小的新方向。论文一年多被引用150多次,这个工作受到了国内外权威媒体的广泛报道,包括参考消息、新华社、麻省理工技术评论、英国卫报等。此外,我们把这些算法和模型应用到工业场景的实际问题中,例如解决外卖订餐场景的复杂查询的语义理解问题,阿里小蜜用户情感检测和情感安抚问题,在实际业务系统中取得了显著的性能提升,产生了良好经济效益。

实际应用

我们团队长期以来与企业界建立了广泛的联系,我们所开发的核心算法在多家公司的产品和业务中实现了“落地”。

❖举例来说,我们的情感分析技术应用在三星的数字产品分析系统中,并且两项专利技术实现了授权应用。

❖在与美团的合作中,我们的复杂语义分析技术应用在美团外卖场景中,使得意图理解的性能获得了较大幅度的提升,在意图分类、关键语义信息识别等任务上性能提升显著。

❖在与阿里小蜜的合作过程中,我们的情感检测、情感对话技术、话题分析技术使得阿里小蜜用户的情感检测准确率、用户满意度获得了显著提升,产生了显著的经济效益。

❖此外,我们的对话技术还应用在宝尊电商、薄言豆豆等公司的产品上,实际应用效果显著。

遇瓶颈 求突破

目前人机对话领域所面临的主要困难有两个:一是数据问题,二是人机对话本身的研究难度。

研究困难

人机对话本身研究难度很大。目前对话系统的构建和研究还离不开数据的支撑,很大程度由数据来驱动,但相比英文数据,中文数据方面则严重不足。这很大程度上制约了中文对话系统研究的进展。因此,今年我们花了很大力气构造了两个独特的中文对话数据集,我们也希望有更多学界同仁及企业在中文对话数据的构建和开放上更加活跃。

尝试突破

众所周知,自然语言处理是人工智能皇冠上的明珠,而人机对话则可以称之为明珠中的明珠。通用意义上对话系统可以等同于图灵测试,需要实现真正的语义理解,这本身就是巨大挑战,远还没有达到能解决的程度。这里的核心问题就是对开放领域、开放话题的语义理解很困难。但是在某些特定场景,结合实际应用,则是有可能解决的。我们的很多研究尝试也是围绕这个思路展开,例如在电商客服、外卖、售前咨询等领域,结合知识图谱、专家知识、深度学习算法和模型,做到实际上线标准是可以实现的。但从学术研究的角度,我们还是要着眼于“诗和远方”,聚焦在更难、更前瞻性的问题上。

技术研发与市场需求

作为高校的一个研究者,同时在与企业广泛合作过程更加能够体会到,高校和代表市场需求的企业各有优势,两者结合能产生很好的相互促进作用。高校的优势在于前沿理论、模型、算法研究,而企业的优势在于工程优化能力,两者具有很好的互补性。

我自己在与众多企业合作过程中,就深刻体会到,只有双方紧密合作,才能体现出产学研的威力。例如,我们和阿里巴巴合作的过程中,我们的学生和阿里的员工一起合作,将前沿的算法模型应用在实际业务中,取得了显著性能提升,这里面既有算法模型的威力,也有工程优化的功劳。我们在和美团外卖、搜狗等的合作中也都体现了这些特点。企业在实际业务需求中产生的挑战性、前瞻性问题,也为学术界提供了创新的动力。我也呼吁更多的企业能够开放共享他们的数据,带着他们的问题与学术界一起努力,实现真正的产学研一体化。

未来研究方向

立足当前

目前我们团队在数据集建设、系统开发、平台建设、前沿创新技术四个层面稳步推进。今年我们花费大量精力和财力构建了两个大规模的中文对话数据集,将很快开放给学术界免费使用。

在平台建设上,我们初步研发了针对研究者的开放域对话工具集CoTK和任务导向对话工具集TaTK,这两个工具包提供了搭建对话系统所需的各类组件,包括标准化的数据准备流程,以及标准化的测试流程和测评标准。我们希望能够踏踏实实地做一些小事情,真正推进这个领域的研究进展。

展望未来

我们团队的科研重心集中在人机对话方面,我们希望研究人类对话的机制,并由此启发对话交互的计算模型,在数据集建设、系统开发、平台建设、前沿创新技术四个层面开展深入研究,为推动学术研究和产业应用做出我们的贡献。

LX A i 中 国 网 Q

本文网址:

欢迎关注微信公众号:人工智能报;合作及投稿请联系:editor@cnaiplus.com

AI中国号...

关注微信公众号,了解最新精彩内容