DeepSeek:来自东方的神秘力量

苍穹猎 2025-02-03 03:22:20
这是苍穹猎鹰第365篇演化日记 DeepSeek:来自东方的神秘力量 本文只是小编的观点分享,列举的数据和逻辑只为了分析说明,不构成任何的决策建议。 1月20日下午,管理层召开座谈会,座谈会上共有9个人发言。 他们分别是北京大学经济学院院长张辉,浙江大学党委书记任少波,中国工商银行党委副书记、行长刘珺,国产大模型企业深度求索(DeepSeek)创始人梁文峰,邀博(北京)智能科技股份有限公司董事长魏洪兴,中国机械工业集团有限公司副总经理、总工程师张学东,国家图书馆古籍馆馆长陈红彦,中国医学科学院北京协和医院副院长杜斌,国际运动健将、中国体操运动员邹敬园。 其中梁文峰在网络上引起了热议,他不单是DeepSeek的创始人,还是私募巨头幻方量化的董事长。 所谓的量化投资,简单来说,就是利用数学模型和计算机技术,对金融市场的数据进行分析和预测,从而制定投资策略。 这是一个融合了金融、数学和计算机科学的交叉领域,需要具备深厚的专业知识和强大的技术能力。 1/4大模型的“拼多多” DeepSeek被称为大模型的“拼多多”,追求极致的性价比。 自从2022年11月30日OpenAI发布ChatGPT以来,大模型的竞争烈度就居高不下,各大科技巨头纷纷下场,展开激烈的军备竞赛。 各大厂商纷纷推出了自己的大模型,大家比较常用有字节跳动的豆包、百度的文心一言、阿里的通义千问、腾讯的元宝等等,不胜枚举。 背后就是疯狂地烧钱,因为大模型训练的成本是天价,目前还没有很好地进入商业良性循环。 成立于2023年7月的DeepSeek,却利用不到一年的时间,就力压群雄,将大模型的成本做到了极致。 根据网上数据,2024年5月,DeepSeek发布的DeepSeek V2的开源模型率先拉起了行业内的价格战。DeepSeek V2提供了一种史无前例的性价比:推理成本要被降到每百万token仅1块钱,约等于Llama3 70B的七分之一,GPT-4 Turbo的七十分之一。 同年的12月26日,仅仅时隔7个月,DeepSeek就又发现了DeepSeek V3,再次颠覆了行业对于价格的认知。 DeepSeek V3的API定价为输入每百万tokens 0.5元(缓存命中)/2元(缓存未命中),输出每百万tokens 8元,与字节Doubao-pro-256k输入每百万tokens 5元,输出每百万tokens 9元的水平相当,在国产模型中性价比继续提升。 单纯看这些数据,不是相关技术领域的朋友都得云里雾里,听听业内大佬的发言,就可以判断DeepSeek的行业地位。 微软CEO萨蒂亚·纳德拉在瑞士达沃斯世界经济论坛上表示:“看到DeepSeek的新模型,真的令人印象非常深刻。他们确实有效地开发出了一款开源模型,在推理计算方面表现出色,且超级计算效率极高”。 “我们必须非常、非常认真地对待中国的这些进展。”纳德拉说。 在硅谷,DeepSeek被称作“来自东方的神秘力量”。 2/4技术理想主义 36氪旗下的“暗涌”采访梁文峰时,把他誉为“技术理想主义者”,他在采访中也提醒我们看到时代惯性,要把“原创式创新”提上日程。 万维钢老师在专栏中提到生活黑客精神,小编稍加改动一下,作为技术理想主义者的画像。 第一,积极主动。自己决定干什么和怎么干,而不是随大流,也不是上级强加的任务,更不是外界名利的诱惑,而是发自内心的想做这件事。 第二,理性。理解原理,推崇技术和规律,不被情绪左右,任何情况下都是想方设法解决问题。 第三,实验。真正的技术理想主义者都爱折腾,他们不断刺激和试探系统的边界线,探索其背后规律。 第四,系统。技术理想主义者把一切事物都看成系统。 系统是模块化的,可以把各个部分拆开再重组。系统是按照算法进行的,可以理解这个算法,也可以优化,甚至是可以破解。 培养大量的技术理想主义者,需要相对丰富的物质条、稳定的社会环境和宽松的氛围,目前国内已经具备相应的条件。 而且,我们看到越来越多具备“技术理想主义”气质的企业家和创业者,比如字节跳动的张一鸣、拼多多的黄铮、宇树科技的王兴兴、东方空间的姚颂等,也就是大家熟悉的理工男、技术宅。 他们的风格都是低调、沉稳,痴迷于技术,长年累月地专注于自己的领域。 3/4积分效应 有没有发现,近几年,国内各个领域的科技成果接二连三地爆发,有点让人应接不暇。 借用吴军老师在专栏里讲到的积分关系,它有两个明显的特点,契合当下国内科技领域的突飞猛进。 第一,记忆性,或者说累计效应。也就是说,我们看到的科技飞速进步的结果,不仅仅是当时的原因造成的,而是很长的历史时间积累的结果。 不管是过去的两弹一星,还是航空航天;高端制造还是芯片、汽车,这些成功都不是天上掉馅饼,而是几代人接力奋斗的结果,是一个个“五年计划”、“863计划”、“973计划”等一系列科技专项的长期投入,持续创新带来的。 第二,有滞后效应。也就是说,从原因到结果,会有一个延迟,就如同太阳辐射和气温的关系。 当社会发展到一定的阶段,也就是生产力积累到一定程度,人们生活相对富足,不再为了谋生而找一份工作,而是遵循自己的兴趣和爱好。 未来会有越来越多的年轻人,把时间精力用到自己的兴趣爱好上。 优秀的创新者就会从中脱颖而出,比如音乐人、画家、科研人员、企业家等等,他们最大特点就是专注于自己感兴趣的领域,并乐此不疲地做到极致。 4/4时代的草蛇灰线 去年,家里一个亲戚的小孩高考分数不错,报了刚刚成立的深圳理工大学,结果没被录取,反而上了“华南小清华”、985高校——华南理工大学。 令人目瞪口呆的是,深圳理工大学首次招生,分数居然追平了华南第一名校中山大学,超过华南理工大学14分之多。 就在1月13日,福建福耀科技大学经教育部审批通过,创始人是“汽车玻璃大王”曹德旺,由名校长王树国担任校长,直接喊出口号:对标斯坦福大学。 同样炙手可热的还有西湖大学、南方科技大学…… 这些新型研究型大学,开局即“王炸”。学生、家长都用脚投票,绝不是无缘无故。要知道,能上这些大学都是尖子生中的翘楚,甚至有的分数都能上北大清华。 是什么原因让他们放弃传统的名校,转投新型研究型大学?背后,反应怎样的时代之变? 政策的相关表述已经透露趋势的草蛇灰线,“新质生产力”、解决“卡脖子难题”、产业转型升级…… 读懂这些,未来的轮廓已经大致浮现。 百年过未有之大变局,正在以前所未有的步伐加速演进。 本文只是小编的观点分享,列举的数据和逻辑只为了分析说明,不构成任何的决策建议。 · END·
0 阅读:3
苍穹猎

苍穹猎

感谢大家的关注