称AI仍处于“拨接时代”!Cerebras发布全球最快AI推论解决方案

逢纪说科技 2024-09-01 01:25:05

目标挑战NVIDIA、专门开发AI运算系统的创业公司Cerebras宣布发布“Cerebras Inference”AI推论工具平台,努力打破NVIDIA在AI芯片市场垄断局面。

外媒《金融时报》(Financial Times)报道,包括Cerebras、d-Matrix和Groq等小型公司的目标是在AI芯片市场中获得市场占有率,并将重点放在更便宜、专运行AI模型的芯片上。

Cerebras全新的“Cerebras Inference”平台以CS-3芯片为基础,芯片只有餐盘大小。该公司宣称,这个解决方案在Llama 3.1 8B模型上每秒可生成1,800个Token,在Llama 3.1 70B模型上每秒可生成450个Token,在AI推理速度比NVIDIA Hopper芯片快20倍,但成本仅五分之一。

Cerebras首席执行官Andrew Feldman指出,“击败800磅大猩猩(意指NVIDIA)的方法,是将更好的产品推向市场,我们已从(NVIDIA)那抢走不少有意义的客户”。

CS-3芯片没采用NVIDIA所使用的独立高带宽内存(HBM)芯片,而是提供另一种直接将内存内置于芯片中的架构。Feldman指出,其优势在于内存使用方式,因为内存带宽的限制,会限制AI芯片推论速度,因此将逻辑芯片和内存结合至单一大芯片中,可提供“几个量级的速度”。

也因此,Cerebras的芯片不像GPU和其他处理器,需要界面连接内存才能访问资讯。彭博社报道,Cerebras这个方法依赖由单片硅芯片制成的巨型芯片。通过这种新技术,Cerebras的芯片功能比传统同类产品强,但传统硬件无法容纳这些超大尺寸芯片,必须设计专容纳这些芯片的计算机。

Feldman形容,“直到今天,我们还处于Gen AI拨接时代,没多少GPU可拼凑在一起,实现这个目标”,而他的计算机将颠覆AI产业,使AI系统反应更迅速,如同转换到高速网络。

据悉,Cerebras已提交一份首度在公开募股中出售股票的保密计划,同时创建自家数据中心,试图将芯片销售给微软、亚马逊等云计算服务供应商。

d-Matrix、Groq同样对NVIDIA虎视眈眈

另一家创业公司d-Matrix也有同样的野心。

d-Matrix计划今年底全面推出自有芯片平台Corsair。d-Matrix创办人Sid Sheth指出,该公司将产品与Triton等开放式软件搭配,目前NVIDIA最大客户支持使用Triton等开放软件。应用程序开发人员不喜欢被某种特定工具所束缚,人们也逐渐发现受NVIDIA的AI软件平台Cuda限制。

d-Matrix由创办人Sid Sheth于2019年创立,在新加坡国有基金淡马锡领投的B轮融资中筹得1.1亿美元,不到一年便启动新一轮融资。d-Matrix目标是在今年或明年初筹集2亿美元以上资金。

另一家AI推理竞争对手Groq本月从BlackRock Private Equity Partners领投的投资者那筹集6.4亿美元,估值为28亿美元。知情人士透露,芯片制造商Graphcore上个月被软银以略高于6亿美元收购,少于2016年成立以来筹资约7亿美元的风险资金。

(首图来源:Cerebras)

0 阅读:3

逢纪说科技

简介:感谢大家的关注