推理成本最高可降低83%,豆包概念股午后走强

观察者网 2025-02-12 14:13:41

今日(2月12日)A股市场,豆包概念股午后大幅走强,创业板汉得信息拉升封板,广和通、移远通信、润欣科技、博通集成等纷纷大幅冲高。

同花顺iFinD

消息面上,2月12日,豆包大模型团队在其公号发布文章《全新超稀疏架构,推理成本较MoE最高可降83%》。文章称,近期,字节跳动豆包大模型团队提出了全新的稀疏模型架构UltraMem,该架构有效解决了MoE推理时高额的访存问题,推理速度较MoE架构提升2-6倍,推理成本最高可降低83%。

文章称,该研究还揭示了新架构的ScalingLaw,证明其不仅具备优异的Scaling特性,更在性能上超越了MoE。实验结果表明,训练规模达2000万value的UltraMem模型,在同等计算资源下,可同时实现业界领先的推理速度和模型性能,为构建数十亿规模value或expert开辟了新路径。

0 阅读:134
观察者网

观察者网

观察者网,提供丰富而专业的国际国内资讯。

作者最新文章