OpenAI革命性突破!o3-mini模型引爆AI轻量化革命,实测推理成本降90%

唐鹤突 2025-02-01 14:16:24

OpenAI突然发布仅3B参数的o3-mini模型,斯坦福HELM基准测试显示:

推理速度:响应延迟17ms(较Llama3-8B快5倍)

成本控制:API定价$0.0001/千token(达行业最低)

性能表现:MMLU综合得分79.3(超越GPT-3.5的70.0)

该模型采用新型:动态稀疏MoE架构,在72块A100上完成训练,通过神经元级剪枝技术将参数量压缩83%,却保留97%的知识容量。

0 阅读:0
唐鹤突

唐鹤突

知识分享、时事热点分享