芯片厂商的下一个风口:AI+场景革命?

这是芯师爷 2024-06-23 17:07:47

2023年是大家公认的AI元年,大量的AI大模型、AI应用问世。随着人工智能和深度学习的迅速发展,业界已达成共识——终端与AI的融合是大势所趋。不少人认为,2024年或将是“AI硬件元年”。

当狂热的情绪从生成式AI领域蔓延至各类终端场景,人们开始期待看得见、摸得着的“实体”产生质变,“AI+可穿戴设备”、“AI+PC”、“AI+手机”等概念火爆硬件产业链。但热潮底下,真正变革性的应用似乎还有待探索。

尚未成熟的“AI+”目前在上述领域的应用表现,也让人不禁深思,这个“加”真的“加上了”吗?这股人工智能的风,究竟是盘活市场的概念炒作,还是真的吹到了硬件?AI+场景革命,会是芯片厂商的下一个风口吗?

今天,我们试图探讨:人工智能涌向各类终端应用场景后,产业链上的各类硬件将会朝着何种方向前进?身处不同赛道的厂商们,是否已找到了相对清晰的发力方向,亦或者仍在微光中摸索未来的轮廓?

PART 01 AI+可穿戴设备

传感器

在诸多人工智能与硬件融合的场景中,可穿戴设备被认为是创新空间最为广阔、最有可能催生出全新硬件品类的赛道。

事实也确实如此,ChatGPT引发AI狂潮后,仅仅一年多时间,市面上就涌现出一大批全新的可穿戴AI产品,从形态、功能等层面探索“AI+可穿戴设备”的方向:搭载ChatGPT表盘的智能手表、集成了多模态AI助手的AR眼镜、深度融合AI的智能戒指、号称“AI时代iPhone”的AI Pin、聚焦在对话场景的AI吊坠……

图源:AI Pin 官网

但遗憾的是,尽管智能穿戴全产业链都在积极融入AI技术,但真正具有颠覆性的硬件还未被找到。就算是前段时间被《时代》杂志评为2023年最佳发明之一的AI Pin,也在正式发货后翻车了,用户们的吐槽重点集中于“反应速度过慢、手势识别不准确、发热严重”等问题。

实际上,这也是其他智能可穿戴设备所苦恼的技术难点。从技术层面来看,要实现AI技术的深度融合及应用,可穿戴设备必然需要更强的数据感知、采集、处理和交互能力,而这些需求共同指向了一项技术——传感器技术。

在过往的可穿戴设备解决方案中,传感器仅负责感知与采集信号,计算处理环节则交由MCU,MCU分析后产出控制信号,复杂运算则上传云端处理。但随着AI技术的融入,越来越多厂商开始尝试不依赖MCU,让搭载于可穿戴设备的传感器更加智能,承载部分计算处理的功能。

“在传感器本身做一些简单的处理,实现一些既定的功能,这是必然的趋势。”Bosch Sensortec亚太区总裁王宏宇表示:“不能说所有的传感器都需要智能,但为了提升更好的用户体验,我们认为传感器未来是要有一定的计算能力、一定的思考能力,即具备智能的功能。”

图源:Bosch Sensortec

而在AI处理能力部署的位置上,许多厂商都会选择让边缘AI在MEMS上进行边缘端处理。“对于智能可穿戴设备,边缘AI是很好的选择。”Bosch Sensortec应用工程总监Ruschmeier Frank指出,边缘AI与传感器的融合处理,可以形成分布式的智能支持,使设备在几毫秒内作出决策,从而更好地实现及时响应。

另一方面,数据传输的选择、数据处理及训练也成为了传感器的重要演进方向。不同行业对数据传输的需求各异,例如游戏行业就特别强调数据传输的实时性,绝不允许出现任何延迟。Ruschmeier Frank认为,传感器制造商在未来需要深入思考并解决两个核心问题:第一,应该传输哪些数据;第二,需要传输多少数据,才能确保满足特定行业的需求。

部分厂商不仅仅满足于提供传感器本身,更是开始构建智能传感器的解决方案平台,让可穿戴设备厂商的开发者能够在传感器本身植入一些本地AI算法。传感器厂商将一部分训练的工作交给终端客户,既可以在离线的时候训练传感器,也可以在在线的时候通过传感器、通过算法的融合去训练。

此外,传感器技术的发展还聚焦于降低功耗和提供定制化服务。目前,智能可穿戴设备行业正致力于寻找最适合集成AI技术的产品形态,这导致了对传感器需求的多样化。在激烈的市场竞争中,打造具有差异化的产品特性至关重要。因此,根据客户需求进行定制化处理,已成为传感器制造商普遍面临的挑战。

PART 02 AI+PC

处理器/计算外围芯片/存储器

2023年9月,英特尔首次提出了“AI PC”概念,将其誉为PC产业20年一遇的重大革新。此后,PC厂商和芯片厂商开始对此大举发力,相继推出了一系列相关产品。

IDC预测,AI PC在中国PC市场中新机的装配比例将在未来几年中快速攀升,将于2027年达到85%,成为PC市场主流。

事实上,早在AI PC概念面世之前,市场部分产品已嵌入了一些AI技术,比如AI降噪、AI绘图等。但时至今日,市面上的AI PC所具备的功能,和市面上的AI应用并没有本质差别,且供应链对此概念尚未形成统一明确的定义。

联想与IDC联合提出,AI PC是一个以AI大模型、用户个人数据、本地AI算力及AI生态等软硬件的结合体,并定义只有具备五个特征的产品才算是真正的AI PC。华为则认为AI PC是“非常不错的端侧大模型+端侧的数据整合和融合能力+端侧和云侧算力的整合”,即万物互联和端云协同。

图源:联想与IDC的《AI PC产业(中国)白皮书》

尽管定义上尚未达成一致,但业界普遍认可,端侧AI部署所带来的零部件规格升级将是必然趋势。“AI PC的硬件要求必然越来越高,无论是核心的处理器芯片,还是EC等计算外围芯片,对高算力、存储容量、低功耗等需求都会不断提升。”芯海科技副总裁杨丽宁指出。

因此我们会看到,这波AI PC浪潮中,芯片公司的吆喝声最为响亮。英特尔CEO帕特·基辛格喊出“我们正迈向AI PC的新时代”;英伟达CEO黄仁勋更是宣称“PC行业正迎来一次重生的机遇”;AMD董事长苏姿丰甚至将公司Slogan从“AMD Yes”更新为“AI PC Yes!”。

AI PC产业链的第一批受益者也是他们。为了解决AI本地化运行的首要需求——“算力”,处理器成为了PC产业第一波AI化的核心硬件。

处理器

NPU(神经网络处理器)是第一个卖点。以英特尔、AMD、高通为代表的处理器大厂,纷纷推出了支持本地AI大模型运行的AI PC处理器,并都着重强调NPU性能。

例如,英特尔在2023年12月发布了酷睿Ultra处理器,该处理器首次集成了NPU,能够支持高达200亿参数的大模型在终端设备上运行;高通的骁龙X Elite处理器,号称“为AI PC量身定制”,其NPU的算力高达45 TOPS,能够本地处理超过130亿参数的大模型;

AMD则推出了全球首款集成NPU的x86处理器,并宣布其下一代“Strix Point”处理器将重点强化NPU性能,预计AI性能将实现超过3倍的提升;即使是以自研芯片为卖点的苹果,也被曝M4芯片将主打AI性能,重点放在AI运算核心数、效能及NPU数量。

从处理器功能来看,CPU擅长顺序控制,适用于需要低延时的场景,同时也能够处理较小的传统模型,如卷积神经网络或特定大语言模型;GPU更擅长处理高精度格式的并行任务,例如对画质要求极高的视频和游戏。相比之下,NPU采用数据驱动并行计算架构,模拟人类神经元和突触,特别擅长处理视频、图像等海量多媒体数据,可以快速处理AI算法和大数据集。

图源:摄图网

针对PC端的计算需求,以CPU为核心的算力架构在处理AI神经网络所需的并行计算任务时显得力不从心,且成本效益不高。因此,采用“CPU+GPU+NPU”的异构计算方案已成为业界的主流选择。随着人工智能的日益重要,未来处理器市场可能会形成CPU与NPU并驾齐驱的局面。

同时,AI PC的浪潮也再次卷起了X86和Arm的架构之争。Arm架构凭借其在低功耗、长续航、AI加速和定制化方面的优势,自2023年起吸引了英伟达、英特尔、高通和AMD等行业巨头的投入,他们计划最早在2025年推出基于Arm的PC处理器。此外,微软与高通也展开了合作,致力于将x86架构的Windows核心功能移植到Windows on Arm上。

计算外围芯片

“AI PC至少需要经历三个阶段。”芯海科技副总裁杨丽宁认为,当下PC产业链的硬件升级尚且处于第一个阶段,即以处理器为核心的AI化。下一阶段则是AI应用迎来井喷式发展,从而带动PC生态,但同时海量应用场景也会逐步加重处理器的负荷。

“当负荷足够重时,就需要进入第三个阶段,即必须将一些智能化任务外延给计算外围芯片,这是必然的趋势。而计算外围芯片的未来形态,我们始终认为会朝高性能、高安全、高算力的方向发展。”

从PC硬件的角度来看,最核心且最适合承担PC处理器外延AI功能的就是EC芯片。“2023年12月,我们提出了AI EC芯片的设想,并陆续和客户进行了AI EC芯片的探讨。尽管目前还处于初步产品定义阶段,但已探索出了更多的可能性,比如承担AI PC外部的智能温控、智能语音识别、身份认证等重要的人机交互功能。”杨丽宁分享到。

图源:芯海科技

以语音唤醒功能为例,当计算外围芯片具备分布式智能支持时,处理器甚至解码芯片都可以保持关闭状态,仅激活传感器的接收端。只有在AI完成人声检测后,才会激活编解码器进行深度识别,此时才会采集声音并进行初步处理,随后唤醒CPU进一步处理。他强调:“只有这种分级分段式的智能识别机制,才能真正把PC整体功耗降下来。”

因此,杨丽宁赞同王宏宇的观点,认为在AI处理能力部署方面,AI PC的外围计算芯片应与智能穿戴设备的传感器一样,具备一定的智能处理能力,以实现分布式智能支持,并与边缘AI进行融合处理。

“AI PC未来会形成不同层级的算力网络,比如云端的大模型、端侧处理器的中等模型、边缘侧EC芯片的小模型、以及传感器上的更小模型,每个层级所承担的功能以及传输、计算数据的量级都会有较大的差异。且不同层级之间,还会存在着自上而下或自下而上的,模型的训练、优化和更新。”

存储器

随着算力的提升,AI PC对存储器提出了更高要求。为了有效处理AI产生的大量数据和复杂指令,特别是在运行大语言模型等应用时,内存大小决定模型上限,因此PC存储产品性能和容量必须同步升级。

对于AI PC的存储配置,微软计划在Windows12为AI PC设置最低门槛——需要至少40TOPS算力和16GB内存。英特尔中国区技术部总经理高宇则认为,未来的AI PC的标配是32GB内存,2025年将看到搭载64GB内存的PC开始出货。

尽管目前业界对此还没有统一的标准,但可以肯定的是,AI PC对单台PC的DRAM和NAND Flash容量需求呈现出上升趋势。其中,DDR5内存和QLC NAND SSD正成为满足AI PC存储需求的关键技术。

DDR5可以提供更快的数据传输速率、更大的内存容量、更低的功耗以及更高的系统性能,这些都是AI PC在执行数据密集型任务时所必需的关键特性。随着AI PC渗透率提升,预计将推动DDR5子代迭代以及增加更高速率DDR5内存的需求。目前,三星电子和SK海力士正在计划增加DDR5内存的产量,而美光也宣布将加快向DDR5内存的过渡。

“QLC NAND是解决容量问题的重要路径。”美光企业副总裁暨存储部门总经理Jeremy Werner指出,QLC技术可以做到非常低的产品成本,并不断提升存储容量;在性能上,既可以确保产品的功耗维持在非常低的水平,同时在需要调取相关数据进行读取和写入的时候,又能够迅速唤醒整个系统。

图源:CFMS

美光估计,目前QLC NAND SSD导入PC渗透率约20-25%,2024年将可望加速成长推动,AI PC将带动SSD搭载容量快速提升,朝向TB等级需求迈进。

PART 03 AI+手机

SoC芯片/UFS 4.0闪存

AI手机的概念其实并不新鲜,其流行可追溯至2017年。那一年,苹果发布了搭载A11芯片的iPhone 8,引领了将专用NPU集成到SoC中的潮流。荣耀View 10甚至打出了“你的第一台AI手机”口号,卖点是搭载了海思麒麟970。

据中国电信2018年发布的《AI终端白皮书》,当时的AI手机被定义为搭载AI芯片、能运行AI应用,具备人脸识别、语音助手、场景识别、系统优化等功能。

到了2024年,AI手机的概念再次成为焦点。与以往不同,这次厂商们将搭载大模型功能的手机称为“AI手机”。一时间,所有主流手机厂都推出了自家的“AI手机”及端侧大模型:华为盘古大模型,OPPO安第斯大模型,vivo蓝心大模型,小米MiLM-6B,三星Galaxy AI……

但手机上有大模型,就是AI手机吗?这一点在手机厂商之间也没有达成共识。OPPO将此视为手机行业的第三个重大变革阶段,并宣布“OPPO正式迈入AI手机时代”;魅族采取了更为激进的策略,宣布“停止制造传统手机,All in AI”,并将新发布的魅族PRO 21称为“开放式AI终端”;

另一方面,小米集团总裁卢伟冰持谨慎态度,他认为“AI是未来,是无处不在的能力,但AI手机是噱头”;荣耀CEO赵明更是直言不讳“能够提供生成式AI能力的手机并不等于AI手机,甚至相去甚远。”

图源:卢伟冰微博

那么,究竟什么是AI手机?这个问题至今还没有结论。IDC和OPPO联合发布的《AI手机白皮书》,用4种能力定义了“AI手机”——算力高效利用、真实世界感知、自学习和创作能力。Counterpoint和联发科发布的《生成式AI手机产业白皮书》则提出:生成式AI手机是利用大规模、预训练的生成式AI模型,实现多模态内容生成、情境感知,并具备不断增强的类人能力。

硬件方面,Counterpoint提出5点规格:基于领先工艺和先进架构设计的移动计算平台,拥有集成或者独立的神经网络运算单元(如APU/NPU/TPU),大容量和高带宽的内存,以及稳定和高速的连接,硬件级和系统级的安全防御。

在此,我们重点探讨两类硬件:SoC芯片和UFS 4.0闪存。

SoC芯片

正如AI PC一样,AI手机面临的首要挑战也是提升算力。Counterpoint估算显示,2027年生成式AI手机端侧整体AI算力将会达到50000EOPS以上。因此,在当前阶段,手机SoC芯片的性能提升仍是关键。

图源:《生成式AI手机产业白皮书》

目前,在手机SoC领域,高通、联发科和苹果是三大主要竞争者,它们都在各自的SoC中集成了多个不同的处理器单元,包括CPU、GPU、DSP,以及APU/NPU等独立的AI计算单元,专门负责处理重载的AI任务。

其中,联发科主打“全大核CPU架构+硬件生成式AI引擎”,其最新推出的天玑9300+在端侧支持AI推测解码加速技术,支持主流的生成式AI大模型,同时兼容Al框架ExecuTorch。

高通骁龙8 Gen 3则号称“专为生成式AI设计”,将Hexagon DSP升级为Hexagon NPU,融合调度各个单元的算力,支持在终端侧运行高达100亿参数的生成式AI模型。

作为多代最强手机SoC的推出者,苹果的AI手机SoC方案虽然尚未揭晓,但已经激发了业界和消费者的期待。

Counterpoint判断,未来,专用AI计算单元和异构计算架构将共存于手机SoC中,这也意味着,不同运算单元之间通信带宽的重要性将日益凸显。

UFS 4.0闪存

同样的,AI手机也面临着存储容量和速率的挑战。为了适应端侧AI大模型的需求,传输速度更快、功耗效率更优的UFS 4.0闪存已成为旗舰手机的标配。

UFS是一种为计算和移动系统设计的高性能接口,它通过高速串行接口和优化的协议显著提升了吞吐量和系统性能。其全双工接口支持同步读写操作,进一步提高了数据传输的效率;双通道的数据传输,增加了整体的吞吐量。

2022年8月,JEDEC推出了UFS 4.0标准,理论上其传输速率可达4640MB/s,是UFS 3.1的两倍,是eMMC的十倍以上,同时功耗降低了46%,存储容量高达1TB,满足了AI手机对存储容量、运行速度和电池续航的要求,可以实现更流畅、更即时的人机交互体验。

而在UFS 4.0基础上,存储厂商也在积极进行升级迭代。例如,美光推出了增强版UFS 4.0移动解决方案,与前代UFS 3.1相比,生成式AI应用中的大语言模型加载速度可提高40%。铠侠发布了第二代UFS 4.0,相比第一代产品,提升了18%顺序写入性能、30%随机写入速度和13%随机读取性能,并支持高速链路启动序列(HS-LSS)特性,将启动时间缩短70%。三星也在计划推出UFS 4.0 4通道产品,据称其传输速度和功耗效率相较UFS4.0会有两倍的提升。

同时,业界正在积极参与UFS 5.0标准的讨论,这预示着未来AI手机的大模型载入时间有望进一步缩短。当然,UFS 4.0的应用范围不仅限于手机,还扩展到了虚拟现实和自动驾驶等需要处理大量数据的场景。

PART 04

还在等待杀手级应用及颠覆性时刻

回到开头的问题,随着AI技术向各类终端应用场景的广泛渗透,产业链中相关硬件的发展方向已经出现雏形,但尚未完全明确。尽管如此,各大厂商正基于各自的理解,积极地与产业链上下游讨论、碰撞,不断探索更多可能性,推动硬件之外的创新。

观察“AI+可穿戴设备”、“AI+PC”、“AI+手机”三大场景,我们可以发现,尽管不同形态的AI终端产品对AI性能、功耗、精度的要求各异,但它们对硬件的感知能力、计算力、存储容量、智能化水平和数据安全性的需求趋势是一致的。

同时,如何在发挥硬件优势的基础上,串联和构建应用生态,形成不同场景、不同终端间的连接互联,为用户带来更多AI使用场景,也成为了厂商共同的期待与考验。

回到当下,大模型落地仍在探索阶段,AI可穿戴设备、AI PC和AI手机的面貌还很模糊。无论是厂商还是消费者,都在等待真正意义上的杀手级应用以及颠覆性时刻的到来。

但值得庆祝的是,随着人工智能与终端场景的深度融合,AI时代又离我们普通人更近了一步。

期待“AI Everything”的到来!

0 阅读:0
这是芯师爷

这是芯师爷

感谢大家的关注