2023年5月31日,马斯克来华访问商务部,根据当时外媒的报道,他所乘坐的ModelX在那次直接停到了商务部门口,而在此之前,特斯拉的车不被允许进入党政机关。结合彼此半月前上海经信委领导在访问特斯拉上海工厂提出的“进一步深化合作,推动自动驾驶功能板块在沪布局”,外界猜测是FSD将在华落地。
到今年7月,马斯克在财报会议上提出会在今年年底前获得欧洲和中国监管部门批准,以在本地推出FSD系统。但到了9月,这个预计时间延期,变成了2025年1季度。而实际业内的人评估,2025年Q1落地,恐怕也很悬,有数据安全和芯片制裁两方面的原因。更确切地说,是特斯拉工业化数据处理流程的完整性,与超算中心构建中的GPU从何而来的问题。而这二者分别对应特斯拉与中国的博弈,与中、美、特斯拉三方的博弈。
一、中、特博弈:工业化数据处理流程的完整性
数据安全是我国一直在提的基本安全之一,而关注特斯拉FSD的人也基本了解国家在数据安全对其的顾虑。但是,网络上大多数的讨论,集中在卡点采集方面,和数据后续训练不能出境的方面,对应的讨论方案则是对交给特斯拉的数据进行严格脱敏,以泛化能力补充其余方面;以及在国内修建超算中心。超算中心涉及到被管制的英伟达A100、H100芯片,我们会在第二部分详讲。
四月份时,路透社发布的新闻里提到,据消息人士称,百度会授权特斯拉使用在中国公共道路上收集数据的测绘许可证,以让特斯拉的车队具备收集道路布局、交通标志、附近建筑物等环境信息。这应对的就是采集端的问题。官方其实还未发布准确的合作信息,但这种沟通一直在进行中。
道路原生数据的采集是国家非常关注和谨慎的事,但它在整个智驾的大规模数据工程化流程里,只是最初的一部分,更为重要的是后续一整个工业化的数据处理流程。
原生数据在到超算中心(云端)处理的过程中,一定要在车端进行结构化预处理,而这个预处理的转换过程直接影响上传数据的质量和后续数据的实用性。
以一辆10V配置的汽车为例,其每秒产生的数据量是100M左右,即一分钟5.86G左右,这样的数据量无法全部上传云端,必须在车端进行结构化的预处理。这种预处理,一方面要通过结构化缩小它的内存,一方面要确保在剪裁数据后,这些数据依然精准可用。对算法的要求很高。而特斯拉本身构建的那套完整的工业化数据训练流程,包括数据收集、训练、标准、黑白测试等流程闭环,甚至包括超算中心dojo等的基础设施,比国内目前所在的“数据闭环”要先进2~3年。
因此,当数据收集并不由特斯拉掌握,后续这套原始数据,由哪一方(通常是我们的内资企业)以怎样的数据精度交到特斯拉手中,依然会是一个需要仔细思考的问题。这尚且是在特斯拉解决了资质问题之后。因为告诉合作方需要哪些数据,有助于他们延申、尝试、解决算法gap;但如果是由合作方直接预处理数据再交由特斯拉直接进行云端训练,以现在国内落后2~3年的数据闭环状态,这套数据的可用性大概率会下降。
时间,和时间节点,是特斯拉必须思考的事。
如果国内的智驾发展没有这么快,或许特斯拉还可以慢慢来。因为FSD入华,基于中美道路情况不同,必然要做本地化的优化,这就通常需要2年左右的时间将其迭代了较高水平。但国内头部车企、智驾方案提供商目前就已经在提VLM方案了,中美的智驾发展从技术上差别不大,甚至因为中国的道路环境更复杂,(部分城镇还依然有横穿马路情况出现),从算法设计上要考虑的东西更多,特斯拉于此不占优势。特斯拉必须谨慎,在合规的情况下依然尽可能地保证自己在其它方面,比如数据处理的工业化流程、数据量上保持一定的优势,否则他无法和国内的头部车企竞争。
说到底,在中国这一特斯拉全球第二大单一市场,且消费者对电车和智驾有比世界其它国家和区域更高接受度的国家,特斯拉要考虑的就不仅仅是“FSD来到中国”,而是“FSD来到中国后,依然可以占有优势”。
但这正是中国和特斯拉博弈的焦点,因为我们同样想争夺接下来2~3年电车及智驾的市场,希望能在全球让中国品牌站稳脚跟。
二、中、美、特三方博弈:超算中心的GPU从何而来
难以尽快落地的另一个原因是,国内数据不能出去,特斯拉得在国内建超算中心,先不说这本身需要时间,更核心的问题是:芯片管制之下,GPU从哪儿来?
目前美国的特斯拉超算中心涉及到的芯片有3中,英伟达A100、H100,以及特斯拉自研的D1芯片,因为特斯拉是纯视觉方案,GPU是主要芯片,但美国政府制裁的主要也就是GPU,以抑制我国人工智能大模型的发展。A100,H100都在制裁名单里。国内买A100、H100的主要是要训练大模型的互联网玩家,在禁令生效前,除了阿里攒了大概1万枚A100,其它几家,腾讯、字节、百度的A100储量不超过2000。
但马斯克最初在美国建超算中心Dojo,最早就用了5760个A100,在2021年测试时就已处理了1.5PB的数据量。包括从特斯拉车队上8个摄像头各100万个10秒的视频,美国视频以每秒36帧的速度运行,包括60亿个对象标签(甚至包括准确的深度和速度数据)。国内要建立超算中心,这些数值可能是一个最基本的参考。
但A100、H100进不来的情况下,最多只能特斯拉自研的D1芯片进来,但随之而来的问题就是:D1的性能怎么样?产能够用吗?D1出口中国受到的限制严格吗?
性能
D1是台积电代工,用7nm制程,有500亿个晶体管,面积为645平方毫米,能在BF16/CFP8中提供362TFLOPs的算力。它的体积比A100略小,但可能是自制的原因,它对智驾训练的能力比A100更强一点。马斯克希望Dojo总算力达到100exaflops。1exaflops相当于每秒1万亿次计算机运算,此前据外媒的计算,这需要超过27.6万个D1,或约32.05万个A100。D1的所需数量更少,效能更好。此前,也有美国研究机构表示:D1处理视频数据的速度也比英伟达芯片更快。
产能
根据外媒报道,马斯克曾预期2024年向台积电向台积电订购翻倍的D1订单,达到1万片。可估算其2023年D1为5000片,2024年为1万片。以马斯克最早在美国修建的Dojo超算中心为例,最初是配备了5760片A100,如果中国的超算中心要建设,按D1与A100的算力做等比例换算,也需要至少4960片D1。但对比台积电其它的大额订单量,特斯拉D1的订单量不算太多,台积电制造的优先级相对会没有那么高,需要提前预定,预留生产时间。这也会影响FSD最终落地的时间。
美国出口管制
D1属于CPU,相对A100这样的GPU来说,限制没有那么严格,但美国商务部工业与安全局后来发布的文件扩大了出口管制,对支持人工智能的CPU也做了相应限制。D1的限制级别是regularlicense,美国政府于此通常会考虑以下几个方面:
1)最终用途与最终用户:技术预期用途和最终用户的身份。许可申请要明确该技术属于军用还是民用,并提供关于最终用户的信息,以确保他们未参与可能构成安全风险的活动。
2)技术和规格:被出口项目的详细技术规格,包括其能力和性能特征。
3)目的地国家:关于目的地国家的信息以及与向该国家出口技术的任何潜在风险。
4)遵守出口管制法规:确保出口符合所有相关的美国出口管制法规,包括《出口管理条例》(EAR)及任何特定的先进计算和半导体技术的许可要求。
5)风险缓解措施:为减轻与出口相关的任何潜在风险而采取的措施,例如最终用途监控协议或再出口限制。
当特斯拉预备将D1出口中国时,便可能受到BIS的监管和阻挠。也会因此延长FSD在中国落地的时间。
而当马斯克想将FSD落地中国,筹备超算中心建立中的GPU进口问题,就会成为中美芯片博弈新的“战场”,尤其是下一届是马斯克出资2.77亿美元助推上去的川普,而川普上台后的几个政策,包括减少对电动车的优惠政策,任命马斯克为政府效率部部长,也都能看出来对马斯克的“投桃报李”的意味。那么,在马斯克希望落地FSD到中国,中国希望数据不出国遂需建超算中心的情况下,芯片管制条例在川普时代是否还可以有沟通的余地,就会是一个新的博弈事件。
而如果在芯片管制方面中国能够打开一个口子,对接下来2~3年的汽车智能化,以及可能更久时间的人工智能的对局,都可以预期一些新的局面。
尾声
一个很有趣的事是,正是马斯克性格里力行节约成本的特质,让马斯克从造车这件事本身出发,向上延伸到芯片制造的供应链。在汽车智驾方面,他用FSD取代了英伟达的Orin-X,在超算方面,他也正在用D1取代英伟达的A100,而在当下中美所处的动态的关系里,希望将FSD在全球第二市场上落地的马斯克,在中、美两国政府的腾挪间,或将D1出口至中国,而基于他和川普的关系,如果他本身比英伟达有更大的自由度,那么D1很可能会快速进入并占领中国市场。他和英伟达的“队友变对手”的状态还会进一步加剧。
参考资料:
1.Analystslist2majorissuesTeslamustaddressbeforebringingFSDtoChina
2.TeslaDojo-Wiki
3.Aheadof‘Dojo,’TeslaRevealsItsMassivePrecursorSupercomputer
4.TeslaDojo:ElonMusk’sbigplantobuildanAIsupercomputer,explained
5.AGrowingYard:TheBidenAdministration’sChinaExportControlsAreEnsnaringCPUs
6.Dojo+D1,特斯拉未来要进军AI云服务?
7.Tesla’sFSDregulatoryapprovalisdelayedagaininChina
8.Baidu,TeslaagreeonmappingdealforFSDinChina,sourcessay
9.中信证券:特斯拉FSD入华渐行渐近智能电车下半场将至
10.TeslaIntroducesD1DojoChiptoTrainAIModels