我相信大家这几天最为关注的人工智能公司就是DeepSeek!在之前可能很多人都没有听过这个公司,它叫深度求索,然而这家公司却让很多科技巨头如临大敌。这家公司到底是何方神圣?它为什么有这么大的影响力?为什么像英特尔这样的芯片公司都会出现股价下跌呢?
首先我们需要知道,这是一家成立于2023年的我们中国人的人工智能初创公司,它是由前对冲基金幻方量化创始人梁文峰创立,这是一个仅有不到200人的初创团队,然而它为什么能够有如此大的影响力呢?
首先,DeepSeek通过技术创新,显著降低了AI模型的训练和运营成本。拥有一句很通俗的话,就是它的性价比更高。它的基础训练成本仅为560万美元,这让我想到了,一些报纸上这样说的, OpenAI公司的高级管理人,一年的年薪,不要超过这个投入。更为主要是它的推理成本仅为openai同类模型的2%左右,它采用的是混合专家架构和多头潜在注意力等技术,所以仅激活部分参数,完成特定任务,减少了计算资源的消耗。
而它的一个最大的优势是在于它坚持开源的策略,允许开发者免费使用和定制它的模型,特别是最近的deepseek R1,你可以想象到为什么这两天下载它的数量会这么多。我们在使用的过程中也会发现它的推理表现非常的凸显它的深度思考R1,会有非常严谨的思索过程。对于我们使用这一款AI软件来说,显得更为方便,并且有逻辑性。
它还有一个非常大的优势是在它绕过了硬件的限制,无需依赖,英伟达最先进的芯片也能够开发出高性能的模型,这对于英伟达的影响,你可以看得到。为什么英伟达的芯片的股市一直处于巅峰状态?就是因为大家对AI大模型的认知,更多的是在于硬件方面的需求, 而DeepSeek.成功动摇了多项,固有的设定,对于成本的需求,对于硬件的依赖,还有开源的竞争力!毋庸置疑,目前它所带来的特色也确实会影响一些人的担忧,我们也相信我们国家的Deepseek.一定会开辟一条全新的赛道,让AI.大模型更普惠,更高效!