在人工智能领域,一场激烈的竞争正在上演。去年12月,由国内大模型公司“深度求索”开发的DeepSeek应用推出的DeepSeek-V3在全球AI领域掀起了巨大的波澜,它以极低的训练成本,实现了与GPT-4o(就是念GPT4欧)等顶尖模型相媲美的性能,震惊了业界。时隔不到一个月,DeepSeek又一次震动全球AI圈。
随着DeepSeek推出新模型DeepSeek-R1,1月27日,Deepseek应用登顶苹果中国地区和美国地区应用商店免费APP下载排行榜,在美区下载榜上超越了ChatGPT。这一消息不仅在AI圈内引起了轩然大波,也让广大用户对这款新兴应用产生了浓厚兴趣。那么,DeepSeek究竟好在哪?为什么能以较低的成本取得“大力出奇迹”的效果?开源又是不是大模型未来的发展方向呢?
DeepSeek:性能卓越,用户体验佳
DeepSeek是一款由国内人工智能公司研发的大型语言模型,简单来说,它就像是一个聪明又懂你的助手。它拥有强大的自然语言处理能力,能够理解并回答你的问题,就像你和朋友聊天一样自然流畅。而且,DeepSeek不仅能聊天,还能帮你写代码、整理资料,甚至能帮你解决一些复杂的数学问题。它背后有着复杂的算法和大量的数据支持,就像是一个经验丰富的侦探,能从海量信息中挖掘出你想要的东西。
其实说到类似的大模型,大家第一印象可能是OpenAI开发的ChatGPT。回顾一下,从2024年9月OpenAI发布o1-preview到现在,仅仅过去了不到四个月,市场上媲美甚至超越其性能的推理模型就已遍地开花。然而之所以DeepSeek可以从这众多的模型之中异军突起,是因为它不仅率先实现了媲美OpenAI-o1模型的效果,更是将推理模型的成本压缩到了极低。
这次DeepSeek再次站在全世界的聚光灯下是因为,它推出的新模型DeepSeek-R1延续了其高性价比的优势,仅用十分之一的成本就达到了GPT-o1级别的表现。
从大力出奇迹到小力出奇迹
模型发布后,瞬间引发了海外AI圈众多科技大佬的讨论。例如,英伟达高级研究科学家JimFan就在个人社交平台上公开发表推文表示:“我们正身处这样一个历史时刻:一家非美国公司正在延续OpenAI最初的使命——通过真正开放的前沿研究赋能全人类。看似不合常理,但最有趣的结局往往最可能成真。”
1月26日,游戏科学创始人、CEO,《黑神话:悟空》制作人冯骥评价DeepSeek:可能是个国运级别的科技成果。
DeepSeek更持续引发业内震动,脸书母公司Meta已成立专门小组展开研究和学习。
北京邮电大学人工智能学院人机交互与认知工程实验室主任 刘伟:DeepSeek最大的优势在于它算法的改进和优化,它在算力上得到了节省,在输入数据和语料库上,不像以前要求那么大的数据量和大的算力,这是它的优势。以前如果说OpenAI是“大力出奇迹”,那么DeepSeek就是“小力也可以出奇迹”——小的算力用新的方法也可以出奇迹。
都说“巧妇难为无米之炊”,数据、算力都是大模型的米,而算法就应该是那位巧妇。
刘伟:算法更应该是一个好的厨师,它(DeepSeek)是通过算法把饭做得更香,把这个菜做得更好,原料用得更少,就是数据语料用得更少,然后柴火用得更少,但是做得更好吃!
DeepSeek R1 API价格,图源:DeepSeek
DeepSeek R1模型与o1类推理模型输入输出价格对比,图源:DeepSeek
在南京大学人工智能学院教授俞扬看来,DeepSeek站在前人的基础上,在算法上进行了相应的优化使得训练成本得到大幅降低。
俞扬:OpenAI最初在做 ChatGPT的时候,用了强化学习的技术,但是强化学习的技术是很通用的强化学习的工具,那么这个工具它的要求非常多,所以会导致它的机器要用得很多。但是后来的研究者们就发现其实不需要这么复杂的算法,我们可以针对语言模型来设计出简单的算法出来,这样我们大概可以节省3/4的机器去训练强化学习的过程。在DeepSeek的公布的技术方案中,它的强化学习也使用了这种简化的方案,那么就使得从技术上面来说是可以有很多改进的地方。
开源:未来的发展方向?
此外,值得关注的是,DeepSeek采用了完全开源策略。
曾经OpenAI创立的初衷,也是作为一家非营利组织,希望“以最有可能造福全人类的方式推进数字智能发展,而不受产生财务回报需求的限制。”然而,OpenAI在GPT-3发布之后限制了对模型的访问权限,仅通过API提供服务,在GPT-4发布之后更是隐藏了其训练数据和模型权重、完全走向了“闭源”。
DeepSeek的完全开源策略不仅降低了用户的使用门槛,还促进了AI开发者社区的协作生态。通过开源,DeepSeek吸引了大量开发者和研究人员的关注,他们可以在GitHub等平台上自由获取和修改模型代码,共同推动AI技术的发展。英伟达AI科学家Jim Fan称赞DeepSeek是“真正开放的前沿研究,赋能所有人”。
国内的某大模型创业企业的CEO陈里奥告诉记者,开源的好处是显而易见的。这种开放式的创新模式可以激发更多的创意和灵感,推动AI技术的不断进步。
陈里奥:大模型目前还是属于技术早期,没有把它的一些我们很期待的一些历史使命给完成,目前还是在生文生图上比较多一些。高精准的这种逻辑计算、数学、编程类的,其实还没有完全在大模型层面完成。然后其实技术还是认为是在偏早期的阶段,那技术早期大家一起贡献这样才能快一些。
当然,开源也面临着一些挑战和问题。例如,如何保护知识产权、如何维护开源社区的秩序和稳定等。
俞扬:实际上开源只是一种商业模式,那么即使是开源的东西都是有版权的,所以实际上说开源和闭源之争,其实更多的是说这种商业模式之间,它的哪一种商业模式可能在这种特定的场景、特定的时代上面可能会更有效一些。
有人把DeepSeek的成功归功于这是一个关于中国技术理想主义的故事,也有不少外国人将之比喻为神秘的东方力量。但放在整个AI大模型的产业里看,或许DeepSeek的成功代表了大模型的一种全新发展方向。
刘伟:实际上现在大模型的发展正在发生一些变化,这个变化(是)关于它究竟是不是完全根据算力的大小来判定模型的好坏?现在这个DeepSeek它给大家一个启示,就是说我的算力虽然不高,但是我数据可能不是很多,但是我通过算法的优化可以做得更好一些,这的确也是开辟了这个(新)方向。
桑sang
致敬科创人员!你们是中华民族复兴的伟大实践者、领跑者![点赞][点赞]
要你命干啥
做空美股,发展新质生产力,提升国人凝聚力,给春节带来一个大大的开心~[呲牙笑][呲牙笑][呲牙笑][呲牙笑][呲牙笑]。大国国运来了
软Alpha
国产AI备受国内外关注这个影响力还是很牛的。但是我作为半个外行人不太理解,如果没有足够的数据支撑仅靠算法优化,可能还是无法达到人们对智能这个词的期望。不论如何还是希望继续加油,国产加油[比心][比心][比心]
歡
最先进的美国英伟达显卡不卖中国,中国AI公司只能追求各方面都做到极致了!1981年,学校第二天春游,父母有事不在身边,9岁的我自己和面,洗出几根青菜炒熟做馅,煎了六个饼,作为第二天春游的午餐!同学们还纷纷拿自己买来的食品来换吃,吃了都说味道好!其实不论个人还是集体或国家遇到困难,既然无法回避,就不如去解决他!
犸狸犸狸Hoom
官方参与送车步骤:第一步下载纳米AI,第二步输入邀请码442HN,获200纳米,再输360666,还有200纳米,第三步预约,第四步坐等正月十五开奖,先下载获奖概率大!
侧耳倾听
看了这条信息我就安心了,前面美帝那边花样百出,好不热闹,看得我心惊肉跳,总担心我们是不是远远被甩掉了……这是未来科学技术至高点,我们一定要不断突破。为中国科学技术点赞[点赞][点赞][点赞]
XX
国泰民安!人才辈出!笑容甜美!大国风范!
icon
给deepseek开发人员点赞👍!你们的成功再次证明了中国人不仅是勤劳善良的,而且是最聪明的![呲牙笑]
一颗大橙子
从竞争来说,这就是Ai的上甘岭,使用代和量都差的装备可以搞出成本更低效果更好的效果,打破了惯有的装备优势论,绝对是利好出海的各位;确实可以促进信息技术的民主化,而不是垄断在Tier1国家。
灯!等灯等灯
这就是中国智慧!一个大学,一百来个大学生,就搞定了
毛肚姑娘
整个头条都在播到这则消息,真是体现国家后台的强大