2021 年 1 月 1 日前后,国外网友在硅谷拍到了一些不太多见的特斯拉车型,有Model S,有 Model Y,也有 Model X。
上述车型的相同之处可以概括为以下两点:
- 搭载了 360° 覆盖的激光雷达感知系统
- 牌照均为 63277
63277 是加州车辆管理局批给特斯拉的制造商 ID,这代表上面是一支特斯拉内部的激光雷达车队。
那么我们应该如何看待特斯拉,准确地说是 Elon Musk 本人,在激光雷达的问题上出尔反尔、反复无常、朝三暮四、言而无信、信口雌黄、翻云覆雨的摇摆态度呢:)
Ground Truth
先来看看这几张照片的细节。有赖于造型的独特,我们可以很轻松地分辨出这是激光雷达供应商 Luminar 旗下的 Hydra 系列激光雷达。
Luminar 官方给了 Hydra 系列很明确的定位:Hydra 系列是一套完整的工具集,用于测试和程序开发。
如果说还有什么别的信息的话,那就是在 Luminar 的公开资料里,Hydra 系列的视场角可以达到 120°,也就是 3 台 Hydra 即可覆盖全车 360° 四周范围。
但特斯拉显然不这么认为。特斯拉给每台测试车配备了 4 台 Hydra,以更好的完成 360° 的激光雷达感知。
特斯拉测试激光雷达做什么?这是不是说明,Elon Musk 接下来会把激光雷达加入到 Autopilot 感知体系里?
据一位前特斯拉工程师的说法,特斯拉采购 Luminar 的激光雷达由来已久,在摄像头做深度感知的时候,特斯拉会用激光雷达输出的点云数据做 ground truth 进行比对。
什么是 ground truth? 知乎上有这样一个问题:机器学习里经常出现 ground truth 这个词,能否准确解释一下?
Facebook 研究科学家王赟在下面答:就是「标准答案」的意思。
从 Navigate on Autopilot 到北美已经规模化内测的 FSD Beta,特斯拉正在经历从 2D 视觉识别到 4D(基于时序的视频流)感知的变革。在这个技术架构的跃迁中,特斯拉希望解决一个问题:基于摄像头提供激光雷达级别的 3D 信息感知能力。
在这个过程中,特斯拉将自研的 Vidar(Vision LIDAR)视觉激光雷达算法输出的感知信息和真 · 激光雷达 Luminar Hydra 输出的「标准答案」做 ground truth 进行比对,来实现对算法的快速迭代和改进。
结果导向来看,特斯拉在视觉 3D 感知领域取得了巨大的进展。
下图是 2019 年 4 月 23 日的特斯拉自动驾驶日上,特斯拉展示的结合毫米波雷达和摄像头通过深度神经网络来感知的视频。
从左侧俯视角度可以看到,在左侧车道的 SUV 加速驶离、右侧皮卡逐步靠近的过程中,深度神经网络对距离的预测准确,但对两款车型的大小和朝向预测都出现了偏差。
2020 年 2 月,特斯拉高级 AI 总监 Andrej Karpathy 在 Scaled ML 2020 上做了演讲,其中一张 PPT 展示了特斯拉基于摄像头预测深度信息的最新表现。
下面 6 张小图每张的左上方都有一行小字,其中上面三张分别是左侧前摄像头、前置主摄和右侧前摄像头的预测。
而下图左上方写着 Ground truth Edges、BEV Projected Edges 和 ImageSpace Projected Edges。
其中 BEV 全称 Bird’s Eye View,这就是特斯拉 CEO Elon Musk 所说的基于时序的 360° 视频流感知架构,也是目前特斯拉北美内测的 FSD Beta 的技术底座。
因此,从左到右分别为基于激光雷达点云感知的映射、4D 视觉感知的映射和 2D 图像感知的映射。
可以看到中间的 BEV 映射效果虽然仍然不及左边的「标准答案」激光雷达点云映射,但已经无比接近,在这种简单的路况场景下,几乎没有错误信息。
而右边基于 2D 图像的感知映射,只有距离车辆(图中的紫点)非常近的时候才能呈现一定的准确度,中远距离的感知和「标准答案」相去甚远,完全是一塌糊涂。
总结来说,特斯拉采购 Luminar 的激光雷达,是为了以激光雷达的深度感知为基准,更好地挖掘视觉感知的潜力。
特斯拉会搭载激光雷达吗?
尽管 Elon Musk 多次表态,特斯拉从技术路径层面,不会搭载激光雷达。但行业里一直有一种相当高声量的意见认为,特斯拉不用激光雷达,无非是成本没有达到商业化的临界点。
另一方面,2021 年将会是激光雷达前装量产上车的元年,蔚来、小鹏、宝马、北汽 Arcfox、Lucid Motors,一大批 2021 年发布的新车型都会搭载激光雷达上市。
那特斯拉呢?
2019 年 2 月 19 日,特斯拉申请了一则名为 Estimating Object Properties Using Visual Image Data(使用视觉数据估算对象属性)的专利,专利一作是特斯拉感知 & 计算机视觉负责人、Autopilot 软件总监 Ashok Elluswamy。
特斯拉将上述通过激光雷达点云数据和 4D 视觉感知进行 Ground truth 比对迭代的方法,以专利的形式呈现出来。
在这份专利的详细说明中,有这样一段话引人注目:
For example, once the machine learning model has been trained to be able to determine an object distance using images of a camera without a need of a dedicated distance sensor, it may become no longer necessary to include a dedicated distance sensor in an autonomous driving vehicle.
When used in conjunction with adedicated distance sensor, this machine learning model can be used as aredundant or a secondary distance data source to improve accuracy and / orprovide fault tolerance.
例如,一旦机器学习模型经过训练,能够通过摄像头的图像确定物体的距离而无需专用距离传感器,则不再需要在自动驾驶汽车中包括专用距离传感器。
当与专用距离传感器配合使用时,该机器学习模型可以用作冗余或辅助距离数据源,以提高准确性和 / 或提供容错能力。
这是特斯拉官方第一次对自动驾驶感知冗余设计的公开表态。
众所周知,单一的传感器在自动驾驶感知方面存在失效 / 故障风险,冗余容错更是无从谈起。
在这份专利中,特斯拉首次表态,之所以极限压榨视觉的潜力,是为了使之能够在未来的特斯拉自动驾驶汽车中独立扮演感知冗余 / 辅助的角色。
那么专利中提到的 dedicated distance sensor 专用距离传感器,是指激光雷达还是毫米波雷达呢?
换句话说,在特斯拉的下一代自动驾驶硬件架构 HW 4.0 中,特斯拉会搭载激光雷达还是更高性能的毫米波雷达呢?
2020 年 11 月 12 日,Elon 在答网友问的时候提了两个观点,一是再一次澄清特斯拉并非出于任何主观情绪不采用激光雷达,反例是 SpaceX 研发和应用了激光雷达来使龙飞船和空间站对接;二是再次就摄像头之外的自动驾驶传感器表态:波长低于 4 mm 的高精度毫米波雷达才是更好的选择。
毫米波(Millimeter-Wave,缩写:MMW)雷达,是指工作波长在 1 – 10 mm 的电磁波、对应的频率范围为 30 – 300 GHz 的雷达。
就汽车行业而言,主流的毫米波雷达波长集中在 24 GHz、77 GHz 和 60 GHz(主要是日本),其中 24 GHz 雷达的主要负责近距离感知(SRR),而 60 / 77 GHz 雷达主要负责中长距离的感知(LRR)。
从波长来看,24 GHz 的波长为 1.25 cm,60 GHz 波长为 5 mm,而 77 GHz 的波长为 3.9 mm。
结合各国交管部门开放的雷达频段和 Elon 的表态,再加上过去两年来不时传言的特斯拉自研雷达,我们不难猜测,下一代 Autopilot HW 4.0 更可能会搭载特斯拉自研的 77 GHz 成像毫米波雷达,进一步提升感知系统的冗余和容错能力。
自 FSD Beta 发布以来,特斯拉 Autopilot 部门进入了一周推送一次更新的高速迭代模式。到本周为止,FSD Beta 已经迭代到了第 9 个版本。根据 Elon 的说法,FSD Beta 将在未来一到两周内进入到 Early Access Program 早鸟计划全量推送。
如此神速的进展背后,来自 Luminar 的激光雷达功不可没。冗长的铺垫,终于呼应了标题——
特斯拉:我为激光雷达代言!
出处:见配图水印
等您评论