1月25日,全球芯片制造巨头AMD宣布,已将新的DeepSeek-V3模型集成到Instinct MI300X GPU上。
此举被解读为DeepSeek的实力得到了全球顶尖企业的认可。
就在5天前,1月20日高层今年首场座谈会上,DeepSeek创始人梁文锋成为9位受邀发言的“座上宾”之一。
2023年7月,梁文锋创立了深度求索(DeepSeek),专注于AI大模型的研究和开发。
DeepSeek推出的DeepSeek V2模型,以其高性价比和创新的模型架构,引发了国内大模型价格战,被誉为“AI界的拼多多”。
DeepSeek提出的MLA(多头潜在注意力机制)架构和DeepSeekMoESparse结构,大幅降低了模型的计算量和显存占用,从而降低了推理成本。
据了解,DeepSeek的DeepSeek-V3模型训练成本仅为557.6万美元,而OpenAI训练ChatGPT-4所花费的成本高达7800万美元甚至1亿美元,双方的成本至少有10倍的差距。
在数学、代码能力和中文知识问答方面,DeepSeek-V3甚至超过了ChatGPT-4。
美国的苹果商店上,deepseek已正式超越chatgpt,霸榜美国免费区下载榜首,从tiktok到拼多多,再到今年的小红书,如今又是deepseek,中国应用程序在美国你方唱罢我登场,对美国人的震撼一波接一波!
DeepSeek创始人来自广东湛江,这真的很让人骄傲。
梁文锋的经历就像一部励志大片。
他从小就是学霸,小学六年级就被吴川一中录用,初中就学完高中数学,17岁成高考状元上浙大。
2023年创立DeepSeek,2024年12月发布的大模型“DeepSeek - V3”低成本高性能还开源,轰动硅谷震惊全球。
他的团队不到140人却人才密度极高。他还回湛江吴川过年,这也让家乡更有荣誉感。
他的成功或许也能激励更多年轻人,让他们知道只要努力,小地方也能走出改变世界的人。
全网都在好奇,连小红书上都有人发帖询问,这究竟是一只怎样的团队?
国际上,也有人把创始人梁文锋的访谈翻译成英语,还加了注释,试图从中寻找这家公司崛起的蛛丝马迹。
整理各种资料发现,DeepSeek团队最大的特点就是年轻。
应届生、在读生,特别是来自清北的应届生在其中非常活跃。
他们中的一些人,2024年一边在DeepSeek搞研究,另一边新鲜热乎的博士学位论文刚评上奖。
DeepSeek用实力喊话:莫欺少年穷!
当年美国用芯片卡我们脖子时,绝对想不到会逼出一群"开挂"的中国少年,现在老美的肠子都已经悔青了吧!
连扎克伯格都不装斯文了,公开喊话美国政府应该出手阻碍中国Ai的发展,以保证美国的领先地位。要不是连一点追上的希望都没有,又何必如此狗急跳墙?
最让他们害怕的,不是这一个模型,而是它的创造团队——清一色国产学霸,平均年龄不到28岁,穿着拖鞋在实验室干代码,敢不敢信?!
中国有句古话,“莫欺少年穷”,一个85后的青年掌门人,带着一群95后的学霸们,用手里的键盘,给了那些嘲讽“中国只会山寨”的人一记响亮的耳光!
被封锁的EDA软件?我们自己写!
被断供的AI芯片?我们重新设计!
他们就像武侠小说里被逼到绝境的少年,绝地反击成长为一代大神。
梁文锋说:“我们没有海外大神,全是国内TOP院校的博士生和实习生!”
就是这样一个清华北大“少年班”,白天啃论文晚上调参数,硬生生打破老美的封锁,走出一条属于我们自己的光明大道!
真正的强者,不会在困难面前低头,这条道封锁我们,我们就攻克新关走出新路!
“杀不死我们的终将使我们更强大!”或许,我们该感谢美国的封锁,让我们走出一条属于自己的路!
梦回零零年代
这垃圾连图都不能画,丢人现眼