图:加州大学伯克利分校研究人员发布的《人人皆为舞王》论文和视频,展示了深度学习算法将专业舞者的动作转移到业余爱好者身上的场景
【网易智能讯 10月14日消息】在俄罗斯小说家维克多·佩雷温(Victor Pelevin)的网络科幻小说《智人》(Homo Zapiens)中,名叫巴比伦·塔塔斯基(Babylen Tatarsky)的诗人被大学老友招募,前往莫斯科担任广告撰稿人。凭借其在文字方面的聪明天赋,塔塔斯基迅速爬上了公司高层,他在那里发现,当时有很多事情实际上都是虚拟模拟的结果。而随着越来越复杂的深度伪造(Deepfake)应用出现,让人不禁觉得佩雷温的设想似乎正在慢慢变成现实。
在深度伪造领域,或者研究人员所谓的“合成媒体”领域,大部分注意力都集中在可能对现实造成严重破坏的换脸以及其他深度学习算法带来的危害上,例如模仿某人的写作风格和声音。但是合成媒体技术的另一个分支正取得快速进步,即人体深度伪造。
2018年8月,美国加州大学伯克利分校的研究人员发布了名为《人人皆为舞王》(Everybody Dance Now)的论文和视频,展示了深度学习算法如何将专业舞者的动作转移到业余爱好者身上的场景。虽然这种技术依然处于早期阶段,但它表明机器学习研究人员正在应对更困难的任务,即创建全身深度伪造视频。
同样在2018年,由德国海德堡大学图像处理合作实验室(HCI)和科学计算跨学科中心(IWR)的计算机视觉教授比约恩·奥默尔(Bj?rn Ommer)博士领导的研究小组,发表了一篇关于教授机器以逼真形态渲染人类身体运动的论文。今年4月,日本人工智能(AI)公司Data Grid开发了一种AI应用,它可以自动生成不存在的人的全身模型,并可以将其应用到时尚和服装行业。
虽然很明显,全身深度伪造技术具有有趣的商业应用潜力,如在深度伪造舞蹈视频或体育和生物医学研究等领域,但在当今社会中,恶意使用案例越来越令人担忧。目前,全身深度伪造技术还不能完全愚弄人类的眼睛,但就像任何深度学习技术一样,它正慢慢取得进步。全身深度伪造还需要多久就能变得与现实无法区分?这可能只是时间问题。
合成整个人体
为了创造深度伪造视频,计算机科学家需要使用生成性对抗网络(GANS)。这是由两个神经网络组成的,分别是合成器或称为生成网络,以及检测器或称鉴别网络,这些神经网络在精炼的反馈回路中工作,以创建逼真的合成图像和视频。合成器利用数据库创建图像,而后者从利用其他的数据库,确定合成器给出的图像是否准确和可信。
第一次恶意使用深度伪造技术出现在Reddit上,像斯嘉丽·约翰逊(Scarlett Johansson)这样的女演员的脸被换到色情演员身上。Fast.AI公司的雷切尔·托马斯(Rachel Thomas)表示,当前95%的深度伪造旨在用合成色情行为图像骚扰某些人。他说:“这些深度伪造视频中,有些并不一定使用了非常复杂的技术。但是,这种情况正逐渐发生改变。”
达特茅斯大学计算机科学系主席、专门研究打击视频伪造的图像取证专家哈尼·法里德(Hany Farid)指出,深度伪造应用Zao说明了这项技术在不到两年的时间里发展的速度有多快。法里德说:“从Zao身上,我发现这种技术已经变得非常好,并且抹掉了很多人工痕迹,比如电影版本中的脸部闪烁问题。虽然情况正在改善,但将其大规模运行,下载给数百万人,依然很难。这也正是深度伪造技术成熟的标志。”
海德堡大学的奥默尔教授领导着一个研究和开发全身合成媒体的团队。与该领域的大多数研究人员一样,该团队的总体目标是理解图像,并教授机器如何理解图像和视频。最终,他希望团队能够更好地理解人类是如何理解图像的。
本文网址: