#车东西#无人车落地离不开它!揭秘高质量AI数据这条护城河( 二 )


所以在谷歌Waymo研发数年后 , 中国、美国、欧洲、日韩等地区也相继涌现出大量自动驾驶公司 , 而像是苹果、英特尔、百度、上汽、通用、本田等IT巨头、车企巨头也加入到战局之中 , 一场席卷全球的自动驾驶技术争夺战已然打响 。
正如前文所言 , 在研发高等级自动驾驶技术时 , 还原实际场景的路测数据或交通数据 , 是关键“燃料” 。 在这场自动驾驶技术争夺战的背后 , 高质量的数据已然成为各大玩家护城河建设的重中之重 。
#车东西#无人车落地离不开它!揭秘高质量AI数据这条护城河
文章图片
▲美国街头的Waymo无人车
为了助力本国企业抢占自动驾驶技术高地 , 各国政府也在迅速出台政策为技术应用落地铺路 , 并规范行业发展 。
例如今年2月份 , 发改委、工信部、财政部等11部委联合印发的《智能汽车创新发展战略》 , 给了智能汽车一个较为清晰准确的发展时间规划 , 在业内人士看来 , “战略”勾勒出智能汽车发展的“远大前景” 。
又例如北京最近出台的路测规定 , 已经允许无人车进行载人测试(即无人出租车可以上路测试了) , 但同时也提出了一系列要求 , 比如想要申请载人测试 , 需要先通过实车+仿真测试 , 且此前的无载人测试中 , 最近1年内不能出现过交通事故 。
毫无疑问 , 随着自动驾驶竞赛的逐渐白热化和政策的不断演变 , 自动驾驶行业对行驶过程中涉及的真实场景数据的需求量可谓是日益剧增 , 谁拥有更多的数据 , 谁就能够在这场争夺战中取胜 。 三、云测数据深耕质量致力于为行业提供好数据
自动驾驶研发离不开数据的支持 , 但数据也并非是“傻多” , 还需要质量到位才能发挥作用 。
云测数据总经理贾宇航告诉车东西 , 高质量的数据有三个大框架——还原场景、大数据量、标注精准度高 。
还原场景就是说自动驾驶数据要有针对性 , 比如某自动驾驶公司想训练一下无人车应对十字路口行人摔倒这种突发情况的能力 , 那么算法需要的场景数据就必须是发生在十字路口 , 如果是高速公路则必然不行 。
同样的 , 即使是在十字路口这一特定场景下 , 还要尽可能多的让数据丰富起来 , 比如是白天、黑夜、雨天、阴天的十字路口 , 同时行人的衣着、摔倒的姿势、过程 , 也要尽可能地覆盖更多的可能性 。
只有这样 , 才能让无人车上的AI技术完整识别所需场景 , 并作出正确决策 。
对自动驾驶公司来说 , 想要收集到类似“路口行人摔倒”的场景数据 , 自然十分耗时耗力 。
为了解决这一难题 , 云测数据在北京、横店、天津等地搭建了场景实验室 , 为的就是能够模拟还原不同的场景来进行数据采集 。
#车东西#无人车落地离不开它!揭秘高质量AI数据这条护城河
文章图片
▲云测数据的成员在搭建场景实验室
“比如我们在我们自己的数据采集基地搭建了路口这个场景后 , 会招募上千名群演过来模仿路人摔倒的情况 , 每个人的衣着、行为举止都不一样 , 并且还会考虑到白天、黑夜、黄昏等不同的光照条件 , 来还原客户所需要的场景数据 , 做到足够真实 。 ”贾宇航这样说道 。
通常情况下 , 云测数据团队会使用自动驾驶公司提供的无人车来采集数据 , 以完美匹配该公司的传感器设定 。 而如果暂无车辆可用 , 云测数据团队也拥有自购的各类激光雷达、摄像头等硬件设备 , 并拥有专业人员进行传感器标定 , 可以满足不同自动驾驶公司需求 。
采集足够丰富的数据只是提供“养料”的第一步 , 随后还要对数据中的关键物体(例如车辆、行人、甚至是固定物体)进行标注 , 才能供深度学习算法使用 。
数据标注工作不仅需要标注人员拥有特定领域知识来保证数据标注的精准性 , 同时又对标注工具的熟练使用、以及作业中的效率保证、标准化流转管理等等众多因素有着要求 。 对于自动驾驶公司来说 , 将数据标注工作交给云测数据这类专业公司其实是最好的选择 。


推荐阅读