环球车讯网|FSD Rewrite:特斯拉的模仿游戏( 七 )


相比部分企业在这方面使用人海战术 , 以上的训练任务在特斯拉内部仅由一支几十人规模的精英团队负责完成 。
环球车讯网|FSD Rewrite:特斯拉的模仿游戏
本文图片
这样的训练效率背后 , 是高度自动化的训练机制 。
为此特斯拉 AI 团队正在努力搭建一套用于训练神经元网络的模块化「快训系统」 , 系统中包含多种不同用途的神经网络初始模板 。
如果需要开发的新神经网络属于其中的某一大类 , 只需选择对应的模板自定义搭配即可快速生成初始文件 。
在这之后 , 基于数据的神经网络学习循环 , 即搜索训练素材、标记特征、收集「单元测试」素材、完成「单元测试」流程、跑影子模式验证并循环的这个流程 , 「快训系统」会用尽可能多的自动化机制来完成 。
环球车讯网|FSD Rewrite:特斯拉的模仿游戏
本文图片
而特斯拉最终期望达成的效果就是开发者只需要调用模板做一个新神经网络单元 , 之后的训练流程可以在设定下由系统全自动完成 。
不过神经系统训练量依然巨大 。
环球车讯网|FSD Rewrite:特斯拉的模仿游戏
本文图片
推特用户 James Wang 进行了粗略计算 , 如果在 40% 的浮点运算效率下用英伟达 V100 显卡来做这个事情 , 140 petaFLOP/s 的速度运行一天即为特斯拉每天的浮点运算需求量 。
环球车讯网|FSD Rewrite:特斯拉的模仿游戏
本文图片
而这样运算量如果希望在 3 天内完成 , 需要超过 1,000 个 V100 显卡 , 该系统的费用约为 1,500 万美金 。
所以不难看出 , AI 训练是既耗时又费钱 。 而面对这种情况 , 特斯拉准备了专门的硬件 , 一套性能极其夸张的超算系统 。
Dojo:最强学习机
在自动驾驶日上马斯克透露特斯拉正在打造一台用于自家 AI 训练的超算 , 配合相关软件 , 特斯拉计划用其实现自动化无监督的视频级 AI 机器学习训练 。
马斯克表示 , Dojo 不是集群 GPU 的架构 , 它将用特斯拉自研的芯片和专门为神经网络优化的计算机架构 , 这个超算系统预计会在明年面世 。
今年 8 月 , 马斯克透露 Dojo 的浮点运算能力有望达 1 exaFLOP/s 级别 。 「exa」是 10 的 18 次方 , 目前全球没有任何一套超算系统的运算能力能达 1 exaFLOP , 其中最接近的是日本的 Fugaku 超算 , 对应数据为 442010 TFlop/s , 即 0.442 exaFlop/s 。
如果有 1 exaFLOP/s 的计算能力 , 完成一次前面所说的神经系统训练只需要不到 4 小时 。
环球车讯网|FSD Rewrite:特斯拉的模仿游戏
本文图片
这对于特斯拉也许有点性能过剩 , 马斯克 9 月也在推特上表示特斯拉会在 Dojo 完工后推出商业化的服务器 web service 。 这也意味着 Dojo 还会给特斯拉带来服务器业务收入 。
一家车企为了训练自家的自动驾驶系统做出了可能是全球最强的超算 , 我以为自己已经习惯了特斯拉的各种「骚操作」 , 但这次我依然被震撼到了 。
不仅因为超算是航天航空这样的顶尖科技领域才会用到的东西 , 还有这个事情背后体现出的软件对于特斯拉的价值 。
特斯拉的模仿游戏
全世界的道路都是为人类驾驶而设计的 , 而人类驾驶靠的是视觉感知和后天的驾驶经验积累 。
如果细想 , 人类驾驶需要眼睛、视神经、大脑和驾驶思维 , 既有「硬件」需求 , 也有深度学习的软件需求 。
特斯拉给车配备了摄像头 , 让车有了眼睛;特斯拉研发了神经元芯片 , 给车装上了强大的脑;FSD Beta 带来了 4D 视觉 , 让大脑中有了能看见多维世界的视神经;而 Software 2.0 则在 DATA ENGING 的不断循环中持续地学习增加驾驶经验 。


推荐阅读