AI中国网 https://www.cnaiplus.com
50 美元 + 一台旧手机 = 自主导航机器人?Intel:Yes!

打造一台能够执行人体跟踪、自主导航等高阶任务的轮式机器人,需要多少钱?「应该挺多的吧,」估计大部分人都会给出这样的回答。然而,英特尔实验室最近开源的 OpenBot,只需要 50 美元(一顿火锅钱)和一台从抽屉里翻出来的旧手机(四舍五入成本为 0)。OpenBot 的「大脑」是一台安卓智能手机,「机身」则是花费 50 美元打造的一款电动小车。此外,研究人员还开发了软件堆栈,使智能手机可以对小车执行移动操作。制作似乎很简单,但 OpenBot 实际上能够支持高阶机器人任务,如人体跟踪和实时自主导航。
Openbot 由两部分组成:一部智能手机和一个机器人外壳。
首先,只要有一部智能手机,就能满足三个方面的需求:处理器(CPU、GPU、AI 计算)、传感器(GPS、摄像头等)和通信接口(蓝牙、4G/5G 网络)。
与此同时,机器人身体的制作成本也相当合理。如果拆解开来,你发现几乎都是常规的组装零件:4 个 TT 马达车轮、1 个 L298N 马达驱动板、电池和电池座、螺钉螺母、弹簧 / 橡皮筋、电线等,或许你还需要 2 个橙色 LED 灯。
整个机身加在一起的成本,不过 50 美元而已。3D 打印模型文件也已经开源,可以在 GitHub 上找到。
项目地址:https://github.com/intel-isl/OpenBot/tree/master/body
接下来就可以上路试验了,研究者分别测试了 Openbot 的人体跟踪和自主导航能力。
在测试了 10 种不同型号的智能手机之后,结果显示,Openbot 始终能够稳定地完成人体跟踪任务。
在自主导航任务中,它还学会了巧妙地躲避办公区走廊的盆栽植物。除了成本以外,选择智能手机作为机器人的「大脑」还有很多优势。定制机器人上的硬件组件会很快过时。而消费级智能手机每年都会迭代,分辨率和相机帧率都在不断提升,处理器更快,传感器和通信接口也更新。如此一来,那些售价低廉的二手机,如果能作为机器人大脑,也算是被赋予了第二次生命。智能机的优势不止快速提升的硬件能力,它们还具备蓬勃发展的软件生态系统。这项研究利用移动物理机身和软件堆栈,增强了这款机器人的感知和计算能力。
基于廉价可用的组件设计了一款小型电动车,硬件成本仅为 50 美元,这款电动车可作为轮式机器人的「机身」。
开发了软件堆栈,允许智能手机将小车作为机身,并实现实时感知和计算的移动导航。
该系统能够支持人体跟踪和自主导航等高阶机器人任务。
大量实验表明,该方法不受智能手机型号和机身变化的影响。
那么,这款轮式机器人的制造细节和效果到底如何呢?我们来看详细介绍。大脑没有身体则无法行动。要想利用智能手机的算力和感知能力,机器人还需要一个身体。该研究基于可用的电子器件和 3D 打印零件为这个机器人开发了一个身体,总成本 50 美元,其中 40% 用在了电池上。如果构建多个机器人,则成本还会继续下降。所有零件的详情和价格参见下表 1:
机身的构造包括机械设计和电路设计两部分。下图展示了这款小车的机械设计:

如下图 4 所示,该软件堆栈包含两部分:安卓应用和 Arduino 程序。安卓应用在智能手机上运行,可以提供操作界面,收集数据集,运行高阶的感知和控制任务。Arduino 程序负责低阶的驱动和度量(如度量车轮里程、监控电池电压等)。安卓应用和 Arduino 应用通过串行通信链路进行通信。
该研究将这款轮式机器人与现有的机器人平台进行了对比,参见下表 2。与其他机器人相比,该研究开发的平台拥有智能手机提供的大量处理能力、通信接口和传感器。现有的机器人通常依赖于定制的软件生态系统,这需要专门的实验室人员来维护代码、实现新功能。而该研究使用了安卓系统——最大且持续发展的软件生态系统之一。无需机器人社区多做努力,所有用于传感器集成和处理的低级软件已经存在且不断改进。所有传感器已经实现时钟同步,从而消除了很多现有机器人面临的主要挑战。
Openbot 迎来的第一项考验是人体跟踪(Person Following),第二项考验是自主导航(Autonomous Navigation)。该实验研究了在智能手机上运行复杂的 AI 模型的可行性。研究人员使用目标检测器并应用视觉伺服来跟踪人。实验表明,所有最新的中端智能手机均能以 10 fps 或更高的速度持续跟踪人。
研究人员训练了一个在大多数智能手机上都能实时运行的驾驶策略。学到的策略能够沿着走廊前进,并在交叉路口转弯。研究人员将其与现有的驾驶策略进行比较,并获得与基线相似的性能,而所需参数减少了大约一个数量级。
除此以外,该研究还成功地将驾驶策略迁移到了不同的智能手机和机身上。实验表明,该研究的驾驶策略能够泛化至之前没见过的环境、新对象,甚至动态障碍物(如人),即使是在训练数据中仅存在静态障碍物的情况下。
下表展示了该研究提出的驾驶策略在不同机身上的泛化效果:
论文地址:https://arxiv.org/abs/2008.10631AI中国网 https://www.cnaiplus.com
本文网址: