第三方DeepSeekR1真的没有官方版本智能,如360纳米Ai

安浪看商业的 2025-02-26 05:20:04

DeepSeek R1过于火爆,加上有黑客攻击导致官方版本经常服务器出错,毕竟人家不是互联网大厂那样有成千上万台服务器给互联网用户访问。

好在DeepSeek是开源的,就目前而言,国内大厂基本都配备了DeepSeek R1,连百度、腾讯都在自己的大模型中接入DeepSeek R1,可见DeepSeek让AI大模型厂商都不得不“打不过就加入”,中官方服务器出错时,使用第三方服务就是一个平替方案,其中360纳米AI作为较早接入的平台,我也一直中使用,不过最近发现360 纳米Ai的版本智能程度越来越低了。

随便问个问题,得到的答案完全没法和DeepSeek官方的相比,我记得之前使用满血版会思考很长时间给出较为正确的答案,现在使用下来,连最基本的语义都理解有误,比如我上面的问题,我问“中国近代史最伟大的十个人物”,它连近代史这个限定范围都没能理解,直接回复孔子。

当我再问编程中的问题时,它直接只思考0秒就作出回复,然后得到的答案完全不是我需要的。而使用官方版本,思考65秒以后给出准确的答案,虽然答案还有更好的选项,追问的话它会回答出更理想的答案,但也比第三方部署的版本较为智能。

出现这种原因可能是部署出现bug,或者官方降低了模型的参数量或者量化的大小降低了,另外官方毕竟是数据训练的源头,虽然模型版本没有升级,但是训练投喂的数据可能更丰富了,加上模型的微调等优化,这些可能是第三方部署的模型没有跟上的。

当然,原因是什么,也可以直接问DeepSeek啊,比如向DeepSeek提问“Deepseek R1是开源的,现在很多互联网大厂都部署了DeepSeek R1,但是智能程度比不上官方版本,有这种情况吗,有的话是什么原因”,DeepSeek会给出一些原因,但总的来说,在模型参数量一样,硬件算力一样的时候,智能程度基本上不会有影响的。

0 阅读:107
安浪看商业的

安浪看商业的

感谢大家的关注