OpenAI突然发布仅3B参数的o3-mini模型,斯坦福HELM基准测试显示:
推理速度:响应延迟17ms(较Llama3-8B快5倍)
成本控制:API定价$0.0001/千token(达行业最低)
性能表现:MMLU综合得分79.3(超越GPT-3.5的70.0)
该模型采用新型:动态稀疏MoE架构,在72块A100上完成训练,通过神经元级剪枝技术将参数量压缩83%,却保留97%的知识容量。
OpenAI突然发布仅3B参数的o3-mini模型,斯坦福HELM基准测试显示:
推理速度:响应延迟17ms(较Llama3-8B快5倍)
成本控制:API定价$0.0001/千token(达行业最低)
性能表现:MMLU综合得分79.3(超越GPT-3.5的70.0)
该模型采用新型:动态稀疏MoE架构,在72块A100上完成训练,通过神经元级剪枝技术将参数量压缩83%,却保留97%的知识容量。
作者最新文章
财经TOP
财经最新文章
热门分类