环球车讯网|FSD Rewrite:特斯拉的模仿游戏( 五 )


HW 3.0 芯片让特斯拉有了量产车里的最强大脑 , 4D 视觉让特斯拉看得更远、更广和更准 , 但所谓感知 , 有「感」亦要有「知」 , 特斯拉的神经网络里既有视觉神经也有思考神经 , 和人一样 , 它们也需要学习和积累认知 。 特斯拉寄予 Autopilot FSD 的期望是让它成为可以在全世界所有道路上驾驶的司机 , 这就意味着 FSD 要学的东西非常多了 。
「对道路环境的认知和预判」对计算机而言 , 往简单了说就是视觉图像识别和预测 , 认识各种道路上的特征 , 包括但不限于道路线、道路标识、道路空间、静态物体、动态物体 。 与人一样 , 神经网络识别特征也是通过「经验积累」 。
两个你需要知晓的名词
在说特斯拉的机器学习系统之前还有两个东西要特别介绍一下 , 一个是「队列」 , 另一个是「影子模式」 。
环球车讯网|FSD Rewrite:特斯拉的模仿游戏
本文图片
其中「队列」指的是特斯拉这套系统中关联的自家上路车辆 , 在今年 2 月份已经有约 100 万台 , 这个数量随着交付量的增加会继续扩大 。
这些遍布全球各地的车辆对于系统而言相当于一个个智能终端 , 通过车载摄像头采集的道路数据可以上传系统(注:特斯拉收集的数据是去 ID 处理过的 , 系统不知道数据具体来自哪台车 , 这样可以保护用户隐私) 。
也就是说通过「队列」 , 系统可以采集大量且多样化的道路数据 。
环球车讯网|FSD Rewrite:特斯拉的模仿游戏
本文图片
「影子模式」则比较特殊 。 在「队列」车辆中除去主大脑其实还有一个「分身大脑」 , 它和车辆的主大脑一样可以获取车辆的各种传感器数据并输出各种预测以及驾驶决策指令 。
但与主大脑不同的是 , 「分身大脑」内的神经网络可能是系统下放的测试版 , 而且它做出的预测和各类指令不会用于车辆的控制 。 所以即便这个测试版神经网络的预测和指令出错了也没关系 , 反正系统不执行 。
不过系统会记录「分身大脑」产出的预测和指令的实际正确率 , 并用此评价测试版神经网络的好坏 。 而其中高错误率预测对应的路段 , 系统会记录下相关素材用于后续的神经网络训练和测试 。
通过「影子模式」 , 特斯拉可以高效且安全地得到测试版神经网络的实际上路效果 。
数据驱动的 AI 训练场
针对神经网络的机器学习 , 特斯拉准备了一套名为 DATA ENGINE 的闭环系统 , 其结构明确而且机制非常完善 。
环球车讯网|FSD Rewrite:特斯拉的模仿游戏
本文图片
这套系统的运作大致是这样的:系统上传了某一 Autopilot 无法妥善通过场景的素材 , 其中一些在「影子模式」下报错率很高 , 我称这部分素材为初始素材 。
环球车讯网|FSD Rewrite:特斯拉的模仿游戏
本文图片
环球车讯网|FSD Rewrite:特斯拉的模仿游戏
本文图片
接下来系统一方面会将初始素材收入「单元测试」素材库 , 另一方面系统会在「队列」中搜索并要求回传类似素材 , 回传的这部分素材可以称作海选素材 。 海选素材的数量非常可观 , 但它们与初始素材的匹配度并不会非常高 , 经过筛选标记后 , 海选素材中与初始素材匹配度高的也会被放入「单元测试」素材库 。 如此一来针对初始素材的源场景 , 系统快速地收集了大量类似场景下的「单元测试」素材 。
在这之后 , 特斯拉会利用「单元测试」素材对神经网络进行专项的离线训练和测试 , 相关神经网络经训练并通过「单元测试」后对「单元测试」素材中的源场景具备了更强的处理能力 。
通过「单元测试」后的神经网络 , 特斯拉又会将其下放至「队列」并在「影子模式」下进行验证 。 针对再出现的不足 , 上述流程继续循环 。


推荐阅读