据央视财经新闻报道,马斯克的人工智能初创公司 x AI在直播中发布了其公司最新的Grok 3大模型产品。在直播画面当中,一位来自于杭州的年轻工程师吴宇怀坐在画面的中央位置,紧挨着创始人马斯克。

在x AI公司公布的信息上面显示,团队成员里面有5位来自于中国的华人工程师。其中包括了来自杭州的吴宇怀,以及毕业于浙江大学的张国栋。两人都属于是学霸级别的工程师,在海外大学深造后,留在了海外高科技公司工作。
人才的重要性根据官方信息显示,吴宇怀毕业于多伦多大学,其主攻的专业方向是人工智能技术。后来进入斯坦福大学进行深造,并取得了博士学位,曾经还在谷歌公司工作过,担任其AI项目的研究员,随后进入了马斯克的x AI公司,开始全力推进人工智能技术的研发。

而张国栋毕业于浙江大学,随后进入多伦多大学攻读到博士学位,其研究的技术领域也是与人工智能相关的产业。毕业后曾在微软、谷歌等公司任职,现在是x AI公司的核心工程师之一。

DeepSeek的创始人梁文锋,与x AI的张国栋一样,都是毕业于浙江大学的工程师。不过与张国栋不同的是,梁文锋在浙江大学攻读到硕士之后,并没有出国深造,而是选择在国内创业。他创办了幻方量化公司,主要的创业方向就是现在大热的人工智能技术。
相对于吴宇怀和张国栋,梁文锋刚起步的时候并没有掀起多大的浪花,只是在相关领域当中有所成就。

幻方量化对比微软、谷歌这种美国本土的顶级科技企业,其在企业规模、技术基础、产业链布局上面,都有着明显劣势。尤其是在所能获得的算力芯片上面,美国企业的优势太大了。
从2019年开始,梁文锋的幻方量化公司开始在人工智能领域储备技术力量。他带领团队研发了萤火一号的ai训练平台,使用了1100块GPU芯片,总投资约为2亿元。随后又研发了萤火二号平台,使用了大约10000块来自于英伟达的A100算力芯片,总投资规模提升到了10亿元。

梁文锋及其技术团队在掌握了ai相关的技术后,开始进行通用ai技术的研发。他从幻方量化中拆分出一个全新的公司DeepSeek,专注于民用的大模型技术进行研发。
在梁文锋发展人工智能的阶段开始,到后来的DeepSeek创立。在这一阶段当中,美国已经针对于中国的科技领域进行了全面压制。中国企业获得美国先进芯片的机会无限接近于0,而人工智能技术的发展又离不开高算力芯片的加持,这种情况极大拖慢了中国企业在ai大模型领域的发展脚步。
以往的民用ai大模型市场,被美国open ai公司推出的GPT软件所统治。open ai公司是美国最早期发展人工智能技术的公司,当初英伟达开发出来了第一批支持CUDA技术的算力芯片,这些芯片被英伟达的创始人黄仁勋,亲自交付给了open ai公司,支持其在人工智能领域的发展。

从GPT诞生开始,一直到后期的推广阶段,这款大模型是行业内公认的高水平大模型系统。直到梁文锋将DeepSeek的大模型推出之后,这个情况才有了质变的发展。
DeepSeek一共推出了两款水平较高的大模型系统,V3和R1。
V3大模型的硬件水平,已经被DeepSeek公司进行了公布,采用了2048块来自于英伟达的H800芯片,训练时间仅用了不到280万个GPU小时。根据DeepSeek官方给出的数据显示,其训练成本仅为557.6万美元,这个成本不到GPT-4o的二十分之一。

V3大模型侧重于数学、代码以及中文理解方面的理论推断,并且该大模型已经进行了开源,所有对ai技术感兴趣的开发者,都可以免费使用V3大模型的算法技术。
V3大模型的短板是文字生成类型的处理任务,针对于这个弱点,梁文锋团队又开发了R1大模型,该大模型专注于解决文字生成类型的推断运算。
在此之前,文字生成领域的大模型标杆是open ai推出的o1大模型语言。
R1大模型上市之后,支持联网搜索后进行推理,补齐了V3大模型在长文本推理和分析上面的弱点。并且在FRAMES的测试当中,R1的准确率达到了80%以上;在MMLU测试当中,R1的准确率为90.8%,open ai o1的准确率为91.8%,两款大模型在性能与效果上面的表现不相上下。

DeepSeek两款高水平大模型的推出,受到了美国ai领域的重点关注,甚至还在一定程度上影响了ai芯片供应商英伟达的股价。
梁文锋也凭借着其核心领导者的身份,成为了国内ai领域的优秀青年工程师代表。
人才的竞争在DeepSeek的大模型冲击了美国ai技术领域之后,由马斯克领导的x AI公司便开始全面推进Grok 3大模型的上市。
Grok 3使用了100000个来自于英伟达的H100高性能ai芯片进行训练,通过数量庞大的GPU算力芯片,让其大模型的训练时间缩短到了19天。
夸张的硬件堆叠,加上夸张的训练效率,让这款全新的大模型系统在算力测试上面领先了所有竞争对手,包括DeepSeek与GPT推出的所有产品。


其高水平的算力背后,就是来自于吴宇怀和张国栋等人的技术研发。
相对于DeepSeek的创始人梁文锋,吴宇怀和张国栋选择了另一条在人工智能行业发展的路线。这就引申出了一个老生常谈的问题,完成学业后是留在国内工作,还是去国外的高科技企业工作。
国外的企业,尤其是以欧美企业为主的技术工作岗位,在其开出的薪资待遇、公司的综合实力、发展前景等方面,都是全球领域的顶级水平。
不管是微软、谷歌,还是现在ai领域的龙头英伟达,这些企业所给予技术人员的远不是金钱上面的多少,而是在于引领行业发展的机会。英伟达的创始人黄仁勋,在某一个阶段的个人资产数值,已经超过了英特尔公司的市值。

哪怕是当年苹果公司的乔布斯和斯卡利,就因为乔布斯想要引领一个全新的技术时代,所以他在产品设计以及产品价格上面与斯卡利爆发了剧烈的冲突,最终导致苹果公司罢免了乔布斯的职位,并且将他赶出了苹果公司。

对于技术人员来说,薪资待遇只是吸引他们的一方面,更重要的一方面是,技术工程师需要看到自己能否参与到新技术的开创当中,新时代的技术变革需要有实力的工程师参与进来。
我们不能说在x AI工作的两位中国工程师,他们选择在马斯克公司工作是个错误的选择。如果在将来,这些在海外企业任职的技术工程师可以回国发展,那么这对于国内的技术发展来说,是一个不错的消息。
用户10xxx14
[笑着哭]有意思
用户10xxx07
用中华文明加中国智慧做好中国事情,香蕉人不知虑!
用户16xxx85
不要把外國華人當成中國人。漢奸給中國做了什麼。
福猪哥哥
这样的华人是不爱国的