DeepSeekV4或引入全新记忆架构从已知信息看,这种分工确实能提升长文本处理

科技小周说 2026-01-15 18:40:02

DeepSeekV4或引入全新记忆架构从已知信息看,这种分工确实能提升长文本处理和知识类任务表现,算力消耗也能降一截,甚至能靠CPU内存扩容记忆,不用死磕GPU显存。值得注意的是,记忆与推理的参数配比得精准拿捏,不然反而拖性能。整体来说还不错,不盲目堆参数,而是从架构上优化效率,至于最终效果,还得等V4正式亮相才能见分晓。

0 阅读:4
科技小周说

科技小周说

感谢大家的关注