来源:2017-04-12 08:55:00 热度:

【深度】狂飙突进的写稿机器人大军!

AI中国网 https: //www.cnaiplus.com

上周五,今日头条估值超过120亿美元的消息被刷屏。在内容市场的红海里,身价暴涨的今日头条已成为一条让BAT望而生畏的“大鱼”,寡头围剿和壮士突围间充满变数与可能,技术优势牵一发而动全身。

【深度】狂飙突进的写稿机器人大军!

一项内容市场竞争与人工智能技术结合的产物——写稿机器人,将视线聚焦在百度、阿里巴巴、腾讯、今日头条的新战役中,而逐渐起势的机器写稿产业本身也已成为战役中尤为重要的一环。

在深入调查“机器写稿”产业的过程中,意料之外的两大既成事实让我开始重新审视人工智能和内容生产。这两件事实分别是:

1)在垂直领域的报道中,写稿机器人已经被高频率采用;

2)腾讯、今日头条、阿里和百度,是国内写稿机器人技术应用最早和最为成熟的平台。

了解人工智能技术在专业领域的应用现状,能够更为直观地感受技术革命临近的前奏。更进一步,其在内容领域落地的深远意义在于,将为互联网上游资讯生产流程和数据应用方式的带来颠覆式影响。

而在当下,这一关键阀门就掌握在BAT三巨头和估值超120亿美元的新劲敌手中。为此,智东西特采访到腾讯内容机器人项目负责人、腾讯财经副总监刘康,阿里巴巴大数据价值挖掘专家、第一财经首席数据专家汤开智博士,今日头条相关专家,行业资深人士,进一步解构这场互联网内容和数据重组的入口之争,窥探背后更大规模的文本范式生成市场。

注:近日有消息称百度推出了其智能写作机器人Writing-bots,但据笔者调查暂无可查证的实际应用案例,故此文中暂不做讨论。以“度秘”的赛事解说功能为参考。)

一、 文字背后的机器人

【深度】狂飙突进的写稿机器人大军!

写稿机器人,并非指实体的机器人本身,而是将机器自动生成文本,产出内容的系统抽象化和拟人化。具体而言,写稿机器人多以特定的信息库为基础,通过一定的筛选、分析、运算等信息处理手段,将信息进行重新组合、排列,并套用事先设置好的写作模板,最终输出新闻报道。

“机器写稿”,背后涉及数据挖掘、自然语言处理、机器学习、搜索技术、知识图谱等多项人工智能技术。套用一般的人工智能的要素模型,“特定的信息库”即支持该项技术的“大数据”,“针对文本信息的重组、排列”即为该项产品背后的核心算法。从早期的人工设定模板,到深度学习引入后的机器自我学习和模板优化,“写稿机器人”本身正在不断进化。

机器人介入写稿最早起始于美国老牌报业《华盛顿邮报》。早在2012年年末,《华盛顿邮报》就启动了名为“truth teller(吐真者)”的实时新闻核查项目。它能全程记录新闻报道中的文字、语音等信息,随后与“打假”数据库进行对比,一旦发现异常便会发出警报。

AI中国网 https: //www.cnaiplus.com

本文网址:

欢迎关注微信公众号:人工智能报;合作及投稿请联系:editor@cnaiplus.com

AI中国号...

关注微信公众号,了解最新精彩内容