也许 现在基于1000W Clips 的模型 再上RL 后能力上限仍然是可感知的…因为这个数据集内容丰度与真实世界【通行】相比仍然只是非常小的一部分但是再继续加数据的成本? 已经边际递增了纯胡言乱语
也许现在基于1000WClips的模型再上RL后能力上限仍然是可感知
啊小琪说汽车
2025-11-23 11:22:32
0
阅读:0