SebastianRaschka的大模型架构文章还在更新,最近新增了Mistr

蚁工厂 2025-12-14 10:58:21

Sebastian Raschka的大模型架构文章还在更新,最近新增了Mistral 3的内容magazine.sebastianraschka.com/p/the-big-llm-architecture-comparison基本上常见的开源大模型架构都包含在内了。Mistral 3用的是和DeepSeek V3很类似的架构。科技先锋官

0 阅读:0
蚁工厂

蚁工厂

感谢大家的关注