新智驾|滴滴要对自动驾驶“产品”定义,3密码、76模块只是RoboTaxi的“起点”( 二 )


就算拥有几百辆测试车 , 每年能跑的里程也是非常有限的 。 对应长尾场景 , 今天累计里程能跑到几十万、几百万 , 多的甚至上千万的里程 。
但是 , 有很多场景上千万公里才出现一次 , 有些里程上亿公里才会出现一次 。 而且你要解决这样的场景 , 你要见过同样场景100次、1000次 , 甚至10000次 , 才有足够多的数据解决该场景 。
如此 , 怎么办?
对滴滴而言 , 我们不光有自动驾驶测试车收集这样的场景 , 我们还有桔视 。
桔视是我们为司机师傅提供的安全保护设备 , 主要提供车前行车记录、行程中车内录像、判责及申诉取证等功能 , 50%的滴滴订单都有桔视设备的保护 , 一年下来大概有1000亿公里的数据 。
值得注意的是 , 桔视涵盖的场景非常广 , 包括城市、乡村、城乡结合部等 , 此外晚上也有“奇奇怪怪”的场景 , 包括鸡飞狗跳 , 老年代步车逆行 。
值得注意的是 , 长尾场景不光体现在数据复杂度上 , 还包括交通参与者动作的复杂性 。
例如 , 我们在上海测试到的场景 , 有一个大车挡住对面来的大车 , 而且是跨线过来的 。 你不知道他会变得更违规过来还是回到自己的线上 , 这个过程中 , 预测的难度是很高的 。
这样的预测跑多了以后 , 我们才知道对应的车该如何对应处理 , 同时比较好地跟别人进行交互 。 同时 , 保证我们对这样的车如何做得预测更准确 。
除了我们的自动驾驶车辆外 , 我们还有桔视 , 它大概有5-6个数量级以上的额外数据让我们看到更多的场景 , 然后提取出来变成我们可预见的长尾场景 , 最后在仿真场景里测试 , 以此不断提升我们的算法 。
几十辆、几百辆的自动驾驶测试车是非常有限的 , 因此我们扩展测试里程就是增加仿真 , 仿真可以提升10-100倍左右 。
仿真产生出来的新场景 , 往往其分布跟真实世界场景的分布不尽一致 , 很多时候是我们创造出来的 , 虽然它对我们的算法提供新的挑战 , 但它对我们解决现实中的问题有一定的偏离 。
桔视好处是我们有上千亿级公里数据的自动驾驶辅助 , 1000亿公里不是每公里都有用 , 但它能几乎覆盖所有的长尾场景 , 而且远远不止复制一遍 。
2、数据
滴滴自动驾驶燃料数据分为两种:一部分是与技术迭代相关的数据 , 另一部分是与运营相关的数据 。
滴滴作为网约车平台 , 因为其原生形态会自动产生很多数据 , 包括路程行径轨迹、用户需求、未来预测、轨迹数据、用户行为等 。
L4级自动驾驶车与网约车不同 , 网约车可以从一个城市开往另一个城市 , L4级自动驾驶车是从一个区域开始 , 会受到地理、天气情况 , 以及交通参与者的限制 。
这些限制我们会逐步打开 , 可能以线上OTA方式打开 , 也可能是大版本迭代打开 。 不管怎样开放这个过程 , 它都是一步步展开的 , 不会以城市为单位逐步打开 。
反过来想 , 我们如何在起始范围或者小范围内达到服务客户的目的?
举例来看 , 如果开放区域太小 , 像机场等场景 , 可能订单是很多的 。 如果不在你自动驾驶的区域范围内那就无法服务乘客 , 如此体验很差 , 乘客不会用你的服务 。
怎么做?
新智驾|滴滴要对自动驾驶“产品”定义,3密码、76模块只是RoboTaxi的“起点”
文章图片
滴滴平台每天会产生大量的运营数据 , 8年的累计不仅有数据还有经验 。
其一是经营地图 。 我们把所有数据放在地图看 , 哪些路的收益最大 , 哪些地段有订单 , 哪些地段没有订单 。
最重要的是 , 我们可以确定有没有闭环 , 以及会有多少订单 。
其二是安全地图 。 我们会考虑哪些路段上人类司机开车发生重大事故、刮蹭事故、小事故 , 同时我们会对每个路段进行打分 , 然后用可视化的方式进行标注 。


推荐阅读