您当前的位置:首页 >> 学习
Waymo测试从标记数据中学习的AI驱动系统
发布时间:2019-07-01
 

Alphabet的自动驾驶分拆Waymo今年取得了一些值得注意的里程碑,8月超过1000万现实世界里程的无人驾驶汽车和上周推出商业无人驾驶出租车服务Waymo One。但它的研究人员将目光锁定在未来。

Waymo测试从标记数据中学习的AI驱动系统

在今天发表在Medium上的一篇博客文章中,研究人员Mayank Bansal和Abhijit Ogale详细介绍了一种人工智能驾驶员培训方法,该方法可以监控标记数据 - 也就是说,Waymo以专业驾驶示范的数百万英里注释 - 以受监督的方式。(在此上下文中,“监督”是指机器学习技术,其中提供输入和期望的输出数据。)

“近年来,使用大量标记数据的深度神经网络的监督训练迅速改善了许多领域的最新技术,特别是在物体感知和预测领域,这些技术被广泛应用于Waymo,“研究人员写道。“随着神经网络对感知的成功,我们自然会问自己这样一个问题:......我们能否使用纯粹的监督深度学习方法训练熟练的驾驶员?”

为了创建一个能够模仿专家驾驶员的系统,他们精心设计了一个神经网络 - 恰当地称为ChauffeurNet--通过观察真实和模拟数据的组合,包括地图,周围物体,交通,学会了生成驾驶轨迹灯状态和过去的汽车运动。低级控制器将十点轨迹转换为转向和加速命令,允许AI模型驱动实车和数字车。

该模型以“相当于约60天的专家驾驶数据”为例,采用的技术确保其不会从过去的运动中推断出来并实际应对环境的变化。在测试中,它响应交通控制,如停车标志和交通信号灯,但是当暴露于前所未有的情况时,可预见地表现不佳。

研究人员指出,问题在于驾驶从现实世界驾驶中获得的演示是有偏见的 - 它们只包含在良好情况下驾驶的例子。为了教会网络从边缘情况中恢复,该团队合成了近乎意外和与对象的碰撞,后者与对象相结合,鼓励AI模型避免它们。

ChauffeurNet在模拟环境中表现更好,其中考虑了损失和综合示例,甚至设法在停放的车辆周围轻推,停止交通灯从黄色过渡到红色,并从其轨迹的微小偏差中恢复。当用于在现实世界的私人试车道上驾驶Waymo的克莱斯勒Pacifica小型货车时,它成功地沿着弯曲的车道行驶并处理了停车标志和转弯。

研究人员写道:“全自动驾驶系统需要能够处理现实世界中发生的长尾事件。” “今天在Waymo车辆上运行的规划器使用机器学习和明确推理的组合来持续评估大量可能性,并在各种不同情况下做出最佳驾驶决策......因此,完全由机器学习系统的标准尽管Waymo规划器中的组件可以在Waymo规划器中使用,或者可以用来在规划器的模拟测试中创建更真实的“智能代理”,但Waymo规划器的替换效率却非常高。