一种名为 SonicMoE 的软硬件协同设计方案,旨在通过 GPU 内核优化和新型路由方法,解决 MoE 模型在高粒度(专家尺寸小)和高稀疏度(专家总数多)趋势下的训练效率难题 。代码:github.com/Dao-AILab/sonic-moe论文:arxiv.org/abs/2512.14080需要NVIDIA Hopper GPU科技先锋官

一种名为 SonicMoE 的软硬件协同设计方案,旨在通过 GPU 内核优化和新型路由方法,解决 MoE 模型在高粒度(专家尺寸小)和高稀疏度(专家总数多)趋势下的训练效率难题 。代码:github.com/Dao-AILab/sonic-moe论文:arxiv.org/abs/2512.14080需要NVIDIA Hopper GPU科技先锋官

作者最新文章
热门分类
科技TOP
科技最新文章