重磅发布三款千元级HPilot产品,毫末无图城市NOH火力全开

出行范儿 2023-10-13 10:10:01

今年年初,ChatGPT的成功出圈,使得生成式大模型技术迅速从幕后走向前台,并短时间内在全球掀起了大模型开发热潮,国内外的科技公司纷纷加入“百模大战”行列。

从PPT演示、到参数发展,新一轮的人工智能应用也如火如荼地展开,AI大模型的竞争已经快速进入应用落地的比拼。正如行业已经形成的共识:“所有产业、应用、软件都将被大模型重塑”。

在备受关注的汽车自动驾驶领域也不例外。

今年4月,毫末智行发布了业内首个自动驾驶生成式大模型DriveGPT(中文名“雪湖·海若”),作为先行者将自动驾驶行业带入大模型时代。

如今6个多月过去了,毫末DriveGPT雪湖·海若交出了怎样的成绩单?重感知城市NOH的最新进展有哪些?毫末又有哪些新的技术架构与实践?毫末的辅助驾驶产品如何基于第一性原理实现从“产品”到“商品”再到“用品”的蜕变?……

对于这些疑问,10月11日,如期而至的第九届HAOMO AI DAY都一一给出了答案。

让我们一起看看毫末在技术架构和实践方面又有了哪些创新和优化。

01

三款千元级HPilot产品,极致性价比引领智驾市场爆发

今年以来,中国车市的“内卷”程度史无前例地剧烈。除了终端市场的价格战,以城区智能驾驶(城市NOA)为代表的高阶智能辅助驾驶的量产计划,竞争也是愈演愈烈。

在《BETTER AI,BETTER HAOMO》主题演讲中,毫末智行董事长张凯分享了对2023年智驾市场竞争局势的判断:“2023年我国高阶智能辅助驾驶市场迎来大爆发。”

张凯介绍,目前乘用车销量和智能化指数都在稳步提升,同时智能驾驶渗透率与价格却呈反向增长,乘用车市场L2及以上智能驾驶渗透率达42.4%,2025年将达70%,并普及到10万~20万元的主流车型上。

与此同时,城市NOA迎来量产上车潮,目前占L2及以上辅助驾驶份额的17%,明年这个数字或将提升至40%,2025年将达到70%。今年年初,城市NOA的落地城市仅有广州、上海、深圳等少数几个,如今不少玩家已经将开城目标提升了甚至10倍。

在车企卷功能、卷价格、卷平台、卷渠道的超级内卷时期,成本压力已经逐步传导至供应链,主机厂都在追求性价比更高的智能驾驶解决方案。

这也是为什么行泊分体的硬件设计、一体机逐步退出市场,更具性价比的行泊一体的域控方案将成为主流。

基于这样的行业趋势和判断,以及在智能驾驶领域的技术积累,毫末在第九届HAOMOAI DAY重磅发布了HP170、HP370、HP570三款“极致性价比”智能辅助驾驶产品,预计将在2023年和2024年先后上车。

其中毫末HP170是毫末3000元级“极致性价比”的高速无图NOH,可以实现行泊一体智驾。在硬件配置上,算力5TOPS,传感器方案标配1个前视相机、4个鱼眼相机、2个后角雷达、12个超声波雷达,灵活选装1个前视雷达和2个前角雷达。

场景上,毫末HP170可实现高速、城市快速路上的无图NOH,短距离记忆泊车等功能,并获E-NCAP 5星AEB的高安全标准认证。

这也是行业首个能够实现高速、城市快速路上的无图NOH,并可以做到行泊一体的智驾系统,可以摆脱对高精地图的依赖,从而为客户节省一大笔成本,3000元级的价格让辅助驾驶产品成为最平民化的日用级消费品。

毫末HP370是5000元级“极致性价比”的城市记忆行车与记忆泊车,可以实现行泊一体智驾。硬件配置上,算力32TOPS,传感器方案标配2个前视相机、2个侧视相机、1个后视相机、4鱼眼相机、1个前雷达、2个后角雷达、12个超声波雷达,灵活选装2个前角雷达。

毫末HP370在场景上可实现高速、城快,以及城市内的记忆行车,免教学记忆泊车、智能绕障等功能。毫末的记忆行车可看作是毫末城市NOH的最小集,是毫末城市NOH 的强有力补充,仅需一次学习,就可完成用户日常路线的记忆,且不依赖于车机的导航路线。

据张凯透露,目前HP370已经完成了全部功能的开发,将于明年量产上车,相信HP370凭借极致的性价比,会让城市辅助驾驶产品成为更多用户日常通勤的得力助手。

毫末HP570是8000元级“极致性价比”的城市全场景无图NOH产品,未来将在100+城落地。硬件配置上,算力可选72TOPS和100TOPS两款芯片,传感器方案标配2个前视相机、4个侧视相机、1个后视相机、4个鱼眼相机、1个前雷达、12个超声波雷达,还支持选配1颗激光雷达。

HP570平台采用毫末深度优化的多源感知BEV和占用网络技术,可实现 360度规则世界和非规则世界的无死角感知,但是成本在原本HP550平台的基础上可下降三分之二。场景上,HP570平台可实现城市无图NOH、全场景辅助泊车、全场景智能绕障、跨层免教学记忆泊车等功能。

张凯表示,目前HP570平台已经完成整体架构设计开发,各技术模块已在紧张的功能验证当中,HP570平台的历史使命是打造行业内最具性价比的高阶城市智驾产品。

能在短时间内抢先布局三款全新一代智驾产品,满足高、中、低价位车型的量产需求,也充分证明了毫末的技术实力。这也是毫末依托近几年积累的工程经验和对用户使用数据的深入挖掘,对硬件能力进行的极致挖掘和压榨。

当“价格战”开始从销售终端向主机厂和供应链传导,当智能化功能逐步从高端车型向中低端车型普及,高达数万元的智能驾驶解决方案显然已经不能被车企和用户接受。

从配置和实现的功能来看,毫末全新发布的三款产品,在把价格打下去的同时对系统性能和用户体验的效果进行了大幅度提升,而且面向不同的应用场景,给了主机厂多选择权的同时,也能以更具性价比的解决方案实现量产落地。

毫末的目标,就是“让中低阶智驾便宜更好用,让高阶智驾好用更便宜”,张凯表示,这也是2023年,毫末给中国如此“卷”的智驾市场交出的答卷。

02

200天蝶变生长,自动驾驶大模型时代来临

每次HAOMO AI DAY,毫末都会将自动驾驶的最前沿技术探索和当前实践进展分享给行业。这一次也不例外。

毫末智行CEO顾维灏带来了主题为《自动驾驶3.0时代:大模型将重塑汽车智能化的技术路线》的演讲,分享了毫末对于自动驾驶3.0时代AI开发模式的思考以及毫末DriveGPT大模型的最新进展和实践。

上次的AI DAY,毫末发布了行业首个自动驾驶生成式大模型DriveGPT,目标就是探索一种实现端到端自动驾驶的新范式。这与特斯拉践行的自动驾驶技术路线也是类似的。

推出200天后,毫末DriveGPT在MANA OASIS雪湖·绿洲智算中心也在日夜不停地进化。

首先是DriveGPT训练数据规模提升。

顾维灏介绍,截至2023年10月,DriveGPT雪湖·海若共计筛选出超过100亿帧互联网图片数据集和480万段包含人驾行为的自动驾驶4D Clips数据,以及8700万公里的训练里程。如此巨大的数据规模是人类穷尽一生都难以完成的。

其次是通用感知能力提升。

在感知阶段,DriveGPT通过构建视觉感知大模型来实现对真实物理世界的学习,将真实世界建模到三维空间,再加上时序形成4D向量空间;然后在构建对真实物理世界的4D感知基础上,毫末进一步引入开源的视觉文本多模态大模型,构建更为通用的语义感知大模型,实现文、图、视频多模态信息的整合,从而完成4D向量空间到语义空间的对齐,实现跟人类一样的“识别万物”的能力。

基于自动驾驶的任务特性,毫末DriveGPT对视觉大模型的整个训练流程都做了升级。同时,通过与NeRF技术整合,DriveGPT能实现更强的4D空间重建能力,获得对三维空间和时序的全面建模能力。

此外,毫末DriveGPT的通用认知能力也得到大幅提升。

认知大模型除了感知模型看到的物理世界之外,也必须像老司机一样懂得社会常识、知道这个世界各种现象背后的物理知识。毫末认为,只通过自动驾驶数据是无法训练出这个结果,必须引入外部的大语言模型。

借助大语言模型LLM,DriveGPT的认知大模型将世界知识引入到驾驶策略中,使得自动驾驶认知决策获得了人类社会的常识和推理能力(世界知识),将大幅度提升自动驾驶策略的可解释性和泛化性。

大语言模型LLM已经学习并压缩了人类社会的全部知识,因而也就包含了驾驶相关的知识。为了让LLM更好地适配自动驾驶任务,毫末采用自动驾驶行业数据,对LLM进行了微调,使得LLM能看懂驾驶环境、能解释驾驶行为,做出更优的驾驶决策。

顾维灏认为,未来的自动驾驶系统一定是跟人类驾驶员一样,不但具备对三维空间的精确感知测量能力,而且能够像人类一样理解万物之间的联系、事件发生的逻辑和背后的常识,并且能基于这些人类社会的经验来做出更好的驾驶策略,不仅媲美人类老司机,而且未来能够真正实现完全无人驾驶。

基于DriveGPT大模型开发模式,毫末也给出了七大应用实践,包括驾驶场景理解、驾驶场景标注、驾驶场景生成、驾驶场景迁移、驾驶行为解释、驾驶环境预测和车端模型开发。

顾维灏表示,这些实践让我们对自动驾驶的开发,彻底进入一个和之前完全不同的模式中,“将大大加速汽车智能化的进化进程”。

对于DriveGPT如何赋能车端,顾维灏也在现场介绍了目前的三大测试成果:

第一个是毫末纯视觉自动泊车测试成果。

毫末利用视觉感知模型,使用鱼眼相机可以识别墙、柱子、车辆等各类型的边界轮廓,形成360度的全视野动态感知,可以做到在15米范围内达到30cm的测量精度,2米内精度可以高于10cm。这样的精度可实现用视觉取代USS,从而进一步降低整体智驾方案成本。

第二个是毫末对交通场景全要素识别测试成果。

DriveGPT基于通用感知的万物识别的能力,从原有感知模型只能识别少数几类障碍物和车道线,到现在可以识别各类交通标志、地面箭头、甚至井盖等交通场景的全要素数据。大量高质量的道路场景全要素标注数据,可以有效帮助毫末重感知的车端感知模型实现效果的提升,助力城市NOH的加速进城。

第三个是毫末城市NOH对小目标障碍物检测的测试成果。

毫末在当前城市NOH的测试中,可以在城市道路场景中,在时速最高70公里的50米距离外,就能检测到大概高度为35cm的小目标障碍物,可以做到100%的成功绕障或刹停,这样可以对道路上穿行的小动物等移动障碍物起到很好地检测保护作用。

顾维灏也提到,毫末DriveGPT大模型的应用,在自动驾驶系统开发过程中带来了巨大技术提升,使得毫末的自动驾驶系统开发彻底进入了全新模式,新开发模式和技术架构将大大加速汽车智能化的进化进程。

03

毫末2023年四大战役进入冲刺期

2023年已经进入第四季度的收官阶段,在第七届HAOMO AI DAY上,毫末提出要打响“2023 年四大战役”。如今这四大战役也接近收官,现在的成绩单如何?

首先是“智能驾驶装机量王者之战”。张凯介绍,在中国的自动驾驶公司中,毫末稳居中国量产自动驾驶第一名,辅助驾驶产品HPilot整体已搭载至超过20款车型,用户辅助驾驶行驶里程突破8700万公里。其中,最新搭载毫末HPilot的车型为山海炮HEV版、新摩卡Hi-4S等。

其次是“MANA大模型巅峰之战”,DriveGPT发布200天左右的时间里,累积480万段Clips高质量测试。目前已有生态伙伴17家,助力生态伙伴提效90%。

2023年DriveGPT成功入选“北京市通用人工智能产业创新伙伴计划”成为首批模型伙伴观察员及入选北京市首批人工智能10个行业大模型应用案例。此外,DriveGPT还助力毫末荣获2023中国AI基础大模型创新企业的称号。

第三是“城市NOH百城大战”, 具备城市NOH导航辅助驾驶功能的毫末HP550(原HPilot3.0),将搭载魏牌蓝山在2024年第一季度正式量产上市。

现场,张凯和顾维灏首次公开测试搭载HP550的城市NOH的魏牌蓝山视频曝光,在保定闹市区全程12公里的行驶中,历时35分钟,仅手动接管3次。其中包含21个红绿灯,7个路口转向……重感知路线的毫末城市NOH展现出出色性能,尤其是面对拥堵道路、红绿灯交替以及机非混行等复杂场景,处理得非常自然,产品力行业领先。

最后是“末端物流自动配送商业之战”,末端物流自动配送车小魔驼3.0,售价89999元,是全球首款9万元内中型末端物流自动配送车,可以满足在物流,商超、零售等9大场景的需求。

△毫末小魔驼3.0亮相

值得一提的是,小魔驼即将在2023年第四季度在商超履约配送场景实现盈利。从商业意义上,毫末具备了成为全球范围内首家拥有规模化盈利 L4业务公司的能力。目前,小魔驼已配送超过22万单。

毫末四大战役取得快速进展的关键,是毫末始终坚定智能驾驶基础设施的持续投入,以大数据、大模型、大算力为技术方向,以数据驱动为核心,重视产品能力与用户体验的统一,坚持海量多模态数据的持续反哺,坚持迈向从感知到认知、端到端自动驾驶大模型的技术路线,坚持超级智算中心的持续扩容与不断升级,从而使毫末的发展更具韧性,更具持久创新力。

△从左至右:毫末智行COO侯军、董事长张凯、CEO顾维灏、CIO甄龙豹

成立近四年时间,毫末始终引领了中国自动驾驶技术风向标,HAOMOAI DAY更是成为中国自动驾驶技术的一面旗帜。毫末坚持的渐进式路线与对技术投入的长期主义,让毫末模式成为中国自动驾驶发展的新范式。

顾维灏曾多次给出判断,经过多年的发展,自动驾驶已经经历了以硬件驱动为主的1.0时代、以软件驱动为主的2.0时代,目前正在进入将持续发展的由数据驱动的自动驾驶3.0时代。

在此次AI DAY上,毫末还首次公布了自动驾驶3.0时代技术架构演进图。

顾维灏认为,自动驾驶3.0时代与2.0时代相比,其开发模式和技术框架都将发生颠覆性变革。在自动驾驶2.0时代,以小数据、小模型为特征,以Case任务驱动为开发模式。而自动驾驶3.0时代,以大数据、大模型为特征,以数据驱动为开发模式。

毫末所认定的自动驾驶演进终局模式是:云端、车端都将实现端到端自动驾驶。

具体来看,在3.0时代,以大数据、大模型、大算力为核心特征,以数据驱动为开发模式。在感知阶段,通过海量数据来训练感知大模型,学习并认识客观世界的各种物体;在认知阶段,通过海量司机的驾驶行为数据和世界知识来训练认知大模型,学习道驾驶常识,通过数据驱动的方式,不断迭代并提升整个系统的水平。

顾维灏介绍,3.0时代的技术框架,首先在云端实现感知大模型、认知大模型的能力突破,并将车端各类小模型逐步统一到感知模型和认知模型,同时将控制模块也模型化。

下一阶段,车端智驾系统的演进路线一方面是会逐步全链路模型化,另一方面是逐步大模型化,即小模型逐渐统一到大模型内。云端大模型也可以通过剪枝、蒸馏等方式逐步提升车端的感知能力,在通讯环境好的地方,大模型甚至可以通过车云协同的方式实现远程控车。

最终阶段,在未来车端、云端都是端到端的自动驾驶大模型。

这也是为什么顾维灏认为,大模型将重塑汽车智能化的技术路线。

如今,毫末已率先在行业布局大模型、大数据、大算力技术发展方向,全力冲刺自动驾驶3.0时代,做AI技术大潮中的乘风破浪者。

0 阅读:9
出行范儿

出行范儿

聚焦有范儿的智能电动车和未来出行,获取一手信息