在谈自动驾驶的时候,人工智能是无法避免的重要部分,并且正在被越来越多的提及。事实上,人工智能影响着自动驾驶中包括图像识别、处理决策等等核心环节。
但目前为止,依然有不少人认为人工智能处在比较初级的阶段,很多场景下依然不能像人类司机那样处理例如分辨人行道、红绿灯等任务。
在巴塞罗那的计算机视觉中心,科学家们研发了一个叫做 Synthia 的系统,能够改变这种现状及认知。Synthia 可以通过模拟真实的城市场景(类似于 VR),从而训练人工智能在驾驶环境中识别和处理各种情况。为了满足车厂等客户的一些特定要求,Synthia 还能提供包括斑马线、植被、自行车等等各种目标物的精确注释,高度模拟四季及雨雪的天气变化。
收集真实数据的困难
如果你相信特斯拉 CEO Elon Musk 的理论,那么你肯定相信自动驾驶车会在未来变得非常安全以至于取代人类驾驶。不过目前为止,即使特斯拉已经具备了不错的自动驾驶功能,但离你只需要在车里翘起二郎腿,等着 Model S 送你到公司还需要一段不短的时间。
神经网络(模拟大脑工作方式的计算机系统,被认为是自动驾驶人工智能的关键部分)目前正在 进行大量自动驾驶的训练,利用图像和视频模拟真实世界中例如汽车、行人、路标等等不同目标物,锻炼它的识别能力。通过识别道路上的不同物体,软件希望车辆 摄像头等传感器能对这些物体进行实时判断,根据具体情况做出刹车、转向、变道、打灯等对应动作。
不过,即使都是真实场景的数据,收集难度也会根据场景产生巨大的差别。
例如在高速等简单路况下,系统更容易收集数据;当遇到一些极端情况时就处理起来相对较难。当然,这些极端场景发生概率不高,典型的有车祸、救护车 突然驶过、道路边停放的工程车等等。怎么让人工智能搞定这些特殊场景?事实上,这需要收集足够数量的真实样本,然后才能完成训练。
不过,在完成极端情况的数据样本收集之后,事情远没有到结束的阶段,因为采集的图像信息需要手动注释。这意味着, 必须要有人手动注释每张图像上的各个元素,并且按照像素级别区分道路上的人行道、行人以及指示灯(听起来就很痛苦和乏味)等不同元素。
在戴姆勒的 CityScapes 项目里,他们就手动注释了超过 20000 张图片,并且把不同物体区分成 30 种不同类别。ADAS 行业的领先者 Mobileye,他们雇用了 600 多人来完成手动注释的工作,并且这个团队会在年底前扩充到 1000 人。
显然,图像注释是一个很复杂、并且需要大量投入才能解决的问题。不过,这依然只能代表收集极端情况数据的一小部分问题。
用虚拟技术搞定图像
在计算机视觉中心,项目负责人 German Ros 和他的团队研发了一种自动图像注释的方法,还能够训练自动驾驶人工智能正确处理各种极端情况。
利用Unity 引擎,研究人员模拟出包含城市及周边地区、行人、自行车、大巴以及复杂天气变化等等因素的真实环境。之后,他们只需要把虚拟汽车放入这个环境,给自动驾驶 车里的传感器设置特定的位置和方向,之后车辆就开始在虚拟世界中行驶,通过摄像头来获取特定角度的图像和视频数据。
由于软件能够准确识别摄像头捕捉的虚拟画面,并且能生成大量真实、准确的已注释图像,因此研究者才把这个「虚拟城市」称为 Synthia,也就是城市场景图像注释集合的意思。
有了这些仿真的图像,这些数据就能被传输到神经网络用于训练。这能节省手动注释所需的大量时间和人力投入,甚至还能帮助软件识别一些他们原本需要大量时间训练的物体。
「人工智能在识别例如行人和车辆的目标时,已经表现的越来越好了。」 Ros 说,「然而,人行道边界和交通灯的识别依然还存在巨大挑战。例如人行道会随着路况、地区产生改变。不过由于 Synthia 的帮助,我们可以专注于这些极端场景,并且避免了实际采集的安全风险。」
目前,研究人员已经收集了超过 213,000 张的虚拟图像和视频场景,并试图验证人工智能能否在虚拟和现实的混合图像中提高软件识别能力。
Ros 说,他们使用混合图像中,只有 2% 的图像来自真实世界,剩下的都来自于 Synthia 的数据库。把基于 8 种不同算法的低分辨率图像(240*180)作为基础,研究团队发现增加手动注释的合成图像能大大提高软件的图像识别能力。
当尝试把这些图像中的区域分类为 11 种更细分的种类时,平均识别成功率从 45% 提高到了 55%。在已经商用的自动驾驶软件中,由于使用了更高分辨率的图像,所以识别准确率会更高。Ros 认为,图像分析才是 Synthia 的最显著优势。
为了获得使用反馈和平台的持续发展,计算机视觉中心的科学家们免费开放了 Synthia 的数据授权。Ros 说,Synthia 已经和车厂有相关商业合作,只是还处在保密阶段。 Synthia 的虚拟自动驾驶车也已经装备了符合车厂规格的摄像头等传感器。
总之,在高度自动驾驶时代到来之前,我们依然需要投入大量的时间、精力、资源来进行研究。Synthia 的应用能合理减少投入,并且不增加风险。对于这类技术,我只想说越多越好。
本文网址: