激光雷达会继续共存,但纯视觉智驾才是趋势

AutoR智驾 2024-12-04 09:59:04

短短几年,自动驾驶软件架构、技术路线发生了翻天覆地的变化,端到端视觉智驾这一趋势到来的时候应该积极去拥抱。

文丨智驾网 元霸‍‍

编辑丨浪浪山与明知山

2024年初始,智驾车企或明或暗开启了一轮“城市NOA全国都能开”的激烈竞赛。

头部车企大多选择了用“去图”去应对全国都能开,年底前华为、小鹏、极越、理想等车企都基本摆脱了对“高精地图”的依赖,部分或全量推送给用户体验相关去图智驾版本。

“去图”化(去高精地图化)的背后是车端感知能力和AI端到端智驾技术带来的云端大模型算法、算力和车端理解能力的增强。而更重要的是,随着数据量的加大,端到端智驾系统对复杂路况的理解、分析能力正突破临界点。

如果说,“去图”是今年智驾比拼最重要的一条赛道,AI端到端同时带来了另一条赛道的突破,也就是“去激光雷达”的视觉智驾正日益展示出应对复杂路况的成熟能力。

今天,马斯克再次在社交媒体上表示激光雷达是错误的解决方案,并强调纯视觉智驾就是复杂道路自动驾驶最有效的方案。

如果说马斯克的话只能代表他的观点,那么纯视觉智驾在中国复杂道路上的表现,则更有发言权。

在近期的“中国智驾大赛”中,极越01和小鹏P7+作为唯二的纯视觉车型,与华为系、蔚来、理想一众激光雷达车型同场竞技,表现也是可圈可点。

上周的分站赛,场地选在没有高精地图覆盖的中山,考验的是智驾系统“无图全国都能开”的能力。

拥有AI端到端智驾的极越01作为比赛中唯一选用纯视觉路线的车型,以小比分差距获得季军。

从榜单来看,极越01与前两名小鹏G6(101.64)、理想L7 (101.41)的比分咬得很紧。此外,极越在13个分项中拿到了8个满分。相比之下,总分第一的小鹏G6则获得了6个满分,而与搭载了鸿蒙智行系统的问界M7、阿维塔11、智界S7三款激光雷达车型相比,极越01也占有分数上的优势。

综合统计,纯视觉的领军极越01在10个城市的战绩是4个冠军1个亚军,1个季军,成绩名列前茅;小鹏P7+是仅在半个月参与了一站珠海站获得了一个第四名,中山站未参赛。

既然极越的表现如此亮眼,是不是意味着纯视觉智驾的春天来了呢?

智驾网认为,由于各家车企的技术路线不尽相同,纯视觉智驾与雷视融合方案(依赖激光雷达的多传感器融合方案)在较长一段时间内会同时存在。

但是,端到端纯视觉智驾正展示出愈来愈强大的处理复杂场景的能力,同时在成本、技术稳定性与开发难度上全方位地超越雷视融合方案。

激光雷达做为一种感知冗余配置的地位更为明确,需要借助激光雷达处理的Corner Case的比例越来越少。

今年,随着AI大模型的兴起,不论是技术迭代、数据闭环、能力成长、用户体验等方面,纯视觉都展示出了巨大优势,甚至可以说,纯视觉已经成为一个趋势。

同时,纯视觉路线的追随者确实也越来越多,目前All IN视觉智驾的主机厂以特斯拉、极越、小鹏汽车为代表,而乐道L60、深蓝S07、智界S7、新问界M5 等鸿蒙智行系车型也在2024年陆续加入了视觉智驾路线。

在国内汽车市场,极越汽车最早站队纯视觉路线,早在2023年初就开启了相关布局,并在2023年10月极越01上市时量产了纯视觉高阶智驾。

从供应商的角度看,这一阵营则更为庞大,华为乾崑、百度阿波罗、卓驭(大疆车载)、大陆智驾、商汤绝影、智驾科技MAXIEYE、Nullmax都是视觉感知智驾技术的供应商,而百度阿波罗、商汤绝影、卓驭都认为视觉智驾就是最终路线。

激光雷达和高精地图在业内曾被称为智驾系统的两大“支柱”,它们会在2024年底被行业抛弃,与马斯克的判断达成一致吗?

我们先来梳理一下,纯视觉智驾路线在即将过去的2024年经历了怎样的发展。‍

首先,视觉感知的水平在显著提升。

在传统认知里,摄像头相比激光雷达应对阴暗、逆光、静态物等场景的能力不足,在沙尘、雨雪等极端天气下也有短板。

伴随技术的发展,摄像头能力的不足如今可以通过技术加持和新思路提升感知能力,并且即便视觉感知出错,大模型也可以在短时间内进行修正。

比如:小鹏汽车的AI鹰眼视觉智驾方案引入了LOFIC架构大大提升了摄像头的全场景感知能力。这项技术的诞生是为了满足CMOS图像传感器对高动态范围的需求。在逆光、大光差、暗光等环境下的信息采集能力更强。并且该架构方案的视觉感知范围也更大,达到了1.8个标准足球场,甚至能够清晰分辨颜色、文字等语义信息。

▲图片来自:3d tof的《HDR技术详细解析》

而作为国内号称“特斯拉FSD平替”的极越ASD,则用大模型大幅提升了视觉算法能力。因为使用了短距“匕首”、中距离“手枪”、长距离“狙击枪”等视觉大模型,极越ASD的视觉感知3D精度可达到厘米级,超越主流激光雷达。

据称,ASD对运动障碍物速度的识别精度也控制在0.1米/秒误差范围内,大幅提升对于栅栏、护栏、水马和施工隔离栏等有一定长度的通用障碍物的边界识别能力,并通过减速、刹停或者绕行等动作完成避障,留出更多安全距离,绕障丝滑程度就像赛车手一样“脑直觉”。

更重要的是,ASD不仅可以识别200米内矿泉水瓶,还能分辨绿植,预判行人的运动轨迹,即使在雨雪、雾霾或者在夜晚、隧道等光线不足的环境中,依然可以准确地感知和识别。

百度智驾负责人王亮曾表示,ASD使用的大模型与百度萝卜快跑同源,即Apollo L4级自动驾驶的大模型Apollo ADFM(Autonomous Driving Foundation Model)。ADFM可以兼顾技术的安全性和泛化性,安全性数倍于人类驾驶员,而且覆盖了几乎全部复杂场景。

可以说,经过2023年的BEV+Transformer+OCC技术跃升,以及2024年大模型加持,视觉感知能力已经远远超越了激光雷达,同时拥有时间+空间的理解能力,在遇到复杂的Corner Case,大模型理解能力的提升甚至可以修正传感器的错误。

大模型技术正在重构自动驾驶。

虽说两种技术路线会并存,但激光雷达的缺点绝对不容忽视。

很多人都同意王亮的判断,就是激光雷达做为精密仪器,移动部件会降低其可靠性,其能力可以被毫米波雷达和超声波雷达分解替代,同时“伪影”问题会对系统造成巨大的干扰,消除“伪影“的处理复杂度极高。

此外,目前车载量产激光雷达的感知数据量依然太少,几乎是摄像头的160分之一。而且激光雷达点云数据还缺少色彩、纹理等关键信息,无法让车辆用这些数据去推测环境意图。

以下图为例,左侧的激光点云无法准确识别物体,而右侧的摄像头图片可以准确分辨出红色交通灯、斑马线以及正在通行的行人和外卖车辆。

某智驾公司工程师曾向智驾网表示,视觉感知路线不仅省掉了激光雷达的成本,在决策效率上也要更快,因为省去了激光雷达感知信息的融合过程。

而从人类驾驶的形式来看,也不需要雷达来辅助,所以在技术上只要拥有了足够强大的视觉感知能力,就可以实现高阶智驾,级别甚至可以达到L4级。

这使得原本专注L4级别的Robotaxi行业,也开始押注纯视觉方案。

10月11日,特斯拉发布的无人驾驶出租车Cybercab正是一款“不需要激光雷达做感知冗余”的L4级无人驾驶车辆。

尽管多家智驾科技公司曾向智驾网表示,视觉感知就是无人驾驶的终极解决方案,但激光雷达做为感知冗余配置在L4、L5级无人驾驶车辆上的配置在当前技术阶段依然是不可取代的。

但马斯克对于Robotaxi上能以纯视觉方案实现完全自动驾驶的路线非常有信心:“使用AI和计算视觉,不需要昂贵的设备,就可以在无监督的情况下实现FSD。”

而商汤绝影CEO王晓刚向智驾网表示:“在短短的这几年的时间里,自动驾驶软件的架构、技术路线发生了几次翻天覆地的变化。今天,这是一个行业发展趋势,在视觉智驾这一趋势到来的时候应该积极去拥抱新的变化。”

我们同意这种观点,虽说两种路线会有共存阶段,但是纯视觉智驾一定会成为下一个不可回避的必争风口。

【关注智能汽车,关注智驾网视频号】

0 阅读:2

AutoR智驾

简介:智驾网,有温度的汽车科技媒体