周三半导体指数(H30184)大涨3%,当中隐隐带有AI芯片类型转向的味道,即半导体芯片的主攻或从训练端开始传导到推理端,同时其他一些因素也有催化,如指数触及区间下沿或引发反弹、产业热点事件临近。
==【美股】推理芯片崛起,训练芯片调整==
近期美股市场上,博通短短不到10个交易日就大涨接近50%,而英伟达反而大跌9%。主要源于博通上周四超预期的财报和乐观展望,而英伟达则因为供应链、业绩超预期不足、推理端市场或被蚕食等问题而调整。这当中最重要的信号是(美股)市场开始预期AI芯片从纯训练端开始传导到推理端。
来源:Wind
(部分细节或不太准确,领会意思):
AI产业发展一开始是需要大算力(GPU)进行模型搭建,但训练出来后,在应用端使用时,由于体积、功耗、成本等原因,会使用ASIC芯片。博通主要是ASIC(专用芯片,主用于推理端),而英伟达主要是GPU(通用芯片,主用于训练端)。
例如训练模型的时候,由于不知道精准度对模型最后效果有多大影响,因此需要用高精准度(如支持32位浮点数)GPU芯片。但模型完成后发现,其实应用的时候只需要8位浮点数就可以完成类似效果,那么在推理端只需要支持(8位浮点数)的ASIC芯片就可以了。
来源:Ashutosh Mishra等著-《Artificial Intelligence and Hardware Accelerators》-2023年Springer出版-P35,国信证券经济研究所
而目前的两个现实是:
(1)数据枯竭担忧
高强度且大规模的模型训练正在“榨干”全球数据库,并且模型扩展边际效益递减的同时算力成本仍然高企。近日,前OpenAI联合创始人、SSI创始人Ilya Sutskever在NeurIPS 2024大会上发表演讲时表示,预训练时代即将结束,数据作为AI的化石燃料是有限的,目前用于AI预训练的数据已经达到了峰值。
这也是为啥之前说如果未来有新的独立大模型,则大概率是基于非公开的垂直行业领域数据,如医学。
(2)推理端需求远远高于训练端
推理芯片的需求量和训练相比,要大上好几个数量级。未来AI手表、AI手机、AI电脑、AI家电、AI汽车等,都需要配置推理芯片。或正如博通的CEO Hock Tan此前所预言:“未来50%的AI Flops(算力)都会是ASIC,甚至CSP(超大规模云计算产商)内部自用100%都将是ASIC”。
==【A股】豆包相关产业芯片反应积极==
相较于训练端,推理端的鏖战才刚刚开始。得益于全产业链和成熟制程优势的中国制造商,或许能在此获得更大机会。
投资界(10次金牛奖)老将董承非近期访谈时,也坚持其过去的观点:“但当AI泛化,走到“AI++”的阶段,这是国内公司更擅长,更有发挥空间的方向。”
近期豆包AI概念相关产业的芯片标的也反应积极:
H**:AI算力芯片龙头(周三大涨8.3%)
H***:智能音频SoC芯片(周三大涨14.6%)
Z***:无线音频SoC芯片(周三大涨14.3%)
L***:物联网Wi-Fi MCU通信芯片及模组(周三大涨7.8%)
==【盘面】接近震荡区间下沿==
来源:Wind
当下市场处于第一阶段(强预期+弱现实)向第二阶段(强预期+强实现)间,更多表现为区间震荡。
从盘面看,当下半导体指数(H30184.CSI)接近区间下沿。虽无法判断半导体是否自此开启反攻,但目前上行空间大于下行空间。
==【事件】行业热点事件临近==
近期行业事件或也有催化,
(1)火山引擎大会12月19日召开。
(2)2025年CES展将于1月7日~1月10日在美国拉斯维加斯国际会议中心举行。在即将到来的展会上,人工智能(AI)成为了焦点。