AI中国网 https://www.cnaiplus.com
为了能够训练这样一个开放域的多因多果生成系统,我们首先获取到了现有中文和英文两种语言最大规模的因果平行语料,包括 3.1亿条英文因果平行语料和超过一千万条中文因果平行语料。后续我们将对学术界免费开放该数据。
事件之间的因果关系是事理图谱当中重要的事理知识。现有的因果知识获取大多数是基于抽取方法,例如通过模式匹配、统计机器学习或深度学习方法从文本中抽取出因果事件对。基于抽取的方法是对世界上已有知识的获取和记录,并不创造新的知识。为此,我们提出了一种获取因果事理知识的新途径——基于生成的方法,作为对传统抽取式因果知识获取的重要补充。
图1 基于关键词指导的因果生成
如图1所示,我们提出了一个关键词约束(图1中的蓝色高亮词即为提供给模型的约束关键词)的开放域端到端因果生成框架 (Zhongyang Li, Xiao Ding, Ting Liu, Edward Hu,Benjamin Van Durme. Guided Generation of Cause and Effect. IJCAI 2020 to be published), 对于任意的开放域句子级事件输入,可生成多个可能的句子级原因或者结果。人工和自动评估指标表明,即使对于全新的输入,我们的方法也可以生成高质量、多语义的原因和结果。
因果生成在线演示平台示例
1.中文因果生成
图2 中文结果生成
图2中展示了针对“车速太快”这一中文输入事件生成的可能的结果事件。
图3 中文原因生成
图3中展示了针对“车速太快”这一中文输入事件生成的可能的原因事件。
2.英文因果生成
图4 英文原因生成
图4中展示了针对“I love my mother”这一英文输入事件生成的可能的原因事件。
图5 英文结果生成
图5中展示了针对“The book was deemed inappropriate for children”这一英文输入事件生成的可能的结果事件。
详细的因果生成系统使用方法可以参见网上使用说明文档:http://openeg.8wss.com/generate/get_help_page/ 。此外,用户不仅可以查看生成结果,还可以通过 点击“删除”按钮删除您认为质量不高的结果,平台将自动为您推送新的结果。这些点击数据将参与模型的校验、改进,进一步提升模型对因果知识的理解与生成能力,感谢大家的支持!
因果知识的获取和因果推理能力的提升是使得当前人工智能突破发展瓶颈,达到人类智能水平的重要手段。自然语言中蕴含了丰富的因果知识,这些知识对于人机对话系统、阅读理解系统、预测决策系统都能起到很好的支撑和可解释作用,在金融、司法、医疗等领域均有广阔的应用前景。
Demo开发人员:高靖龙、李忠阳、丁效(联系邮箱:zyli@ir.hit.edu.cn)
AI中国网 https://www.cnaiplus.com
本文网址: