撰文|何己派
编辑|鄢子为
90后、潮汕人、清华学霸,2024年的AI大模型圈,绕不开杨植麟这个话题人物。
他创办的月之暗面炙手可热,研发的Kimi智能助手,因强悍的长文本处理能力一炮而红。截至2024年10月,该产品月活超3600万,稳坐第一梯队。
这家成立不到2年的公司,估值暴涨,红杉中国、小红书、美团、阿里等机构,组成豪华投资阵容,追着“喂钱”。
2024年8月,消息传出,腾讯参与其最新3亿美元融资,助其估值升至33亿美元,约合人民币240亿元。
人红是非多。
一起仲裁案,将杨植麟和多方投资人卷入风波,掀开明星公司暗流涌动的一角。人事动荡与业务调整,推其走上舆论的风口浪尖。
过去这一年,若用一个词概括杨植麟和他的月之暗面,可能是“颠簸着陆”。
极速起航
北京海淀,走进月之暗面办公区,一架白色雅马哈钢琴,立在门口。
黑白琴键,也组成了公司logo,两者显现了创始人的音乐审美和强烈的个人风格。
酷爱摇滚乐的杨植麟,在清华读书时组过乐队,晋级过校园歌手大赛决赛。他以自己喜欢的一张摇滚专辑《The Dark Side of the Moon》,来为公司起名。
这是家很“杨植麟”的公司,就连核心产品Kimi,也取自他的英文名。
2022年底,ChatGPT发布,杨植麟看到后非常兴奋,预感世界将发生大变化。
他判断,AGI技术的几个重要因素同时被满足:互联网发展20余年积累大量高质量数据;超大浮点数运算的算力基础设施变得成熟;Transformer架构可以被有效地规模化训练。
当时,他已经创业,参与创办了循环智能,这是家面向企业营销客服提供AI软件的公司,做的是To B生意。
在循环的几年,他采用折中的方式做大模型,公司提供技术,合作方提供算力。华为云的盘古大模型、智源研究院的悟道大模型,均有其参与的身影。
这段项目经历,让杨植麟积累了丰富的大模型研发经验,也令他意识到,必须单独创建一家公司,才能真正地做好大模型。
ChatGPT横空出世,机会来了。
杨植麟专门在美国待了一两个月,四处找人聊,并算了笔账,要迅速拿到1亿美元融资。真正的窗口期,只有1个月。
找人找钱,争分夺秒。
按其说法,他与循环CEO陈麒聪达成一致,月之暗面单独成立公司,循环无偿获得月之暗面一定比例的股份。他本人以0元的价格,放弃在循环一半的股份。
从原公司脱身后,他将全部精力,投入新项目,组建一支5人创始团队。其中,张宇韬、周昕宇和吴育昕,均为杨植麟的清华同门,汪箴则来自复旦大学。
这支团队,以杨植麟为绝对核心。
有人评价,月之暗面200多亿元的估值,200亿都来自于杨植麟。2023年,知名科技媒体The Information点名最有可能做出“中国OpenAI”的五个候选选项,四家公司以外,杨植麟单独以个人身份列入。
师承中美AI大牛、多篇顶会论文傍身、字节张一鸣频繁请教的座上宾,杨植麟早在2018年就开始做基于Transformer的语言模型,研究资历远超同龄人,被投资人寄予厚望。
公司首轮融资,于1个月内光速敲定,拿到来自红杉等头部机构6000万美元的启动资金,成立不到3个月,就组建起约40人的技术研发团队,全速投入战斗。
登月踏步
国内大模型厂商里,月之暗面走的是To C路线。
它只有一款产品,即面向C端的Kimi。这与聚焦To B的循环智能,泾渭分明。
这条路不好走。过去很长一段时间里,AI技术在To C侧没有任何成功案例,to B的确定性更高。
但在杨植麟看来,新的技术变量已经出现,AI Native的APP完全有机会。
更重要的是,AGI不能闭门造车,不跟用户共创,就难有足够高质量的数据,无法知道模型被用起来后会产生哪些问题,也难以找到真正有用的场景打磨、落地。
一位从事AI应用的行业人士告诉《21CBR》记者,大模型天生就依赖数据,“模型生成得好还是不好,跟数据的精度有非常大的关系。顶尖模型的技术领先,时间差也就是半年。”
锚定AI to C,杨植麟为Kimi定制的大杀器,是“长文本”。
2023年10月,Kimi首次亮相,背靠千亿参数大模型,支持输入的长文本达到20万字,首次将对话框容量做到了全球第一。
什么概念?彼时Anthropic的Claude-100k模型,最长支持约8万字,Open AI的GPT-4则是约2.5万字。20万字,相当于它们的2.5倍、8倍。
在公司内部,长文本被称为“登月计划”的第一步。对这一技术,杨植麟做了个形象的比喻,参数量决定了大模型能支持多复杂的“计算”,能接收多长文本,则决定了大模型有多大的“内存”。
内存越大,能解锁的应用空间就越大。
对白皮书、研报这类文本进行摘要总结,Kimi能轻松实现,但长篇小说,动辄就是上百万字。5个月后,Kimi再度跨了一大步,升级到200万字,一骑绝尘。
月之暗面称,过去要10000小时才能成为某个领域的专家,现在只需要10分钟,Kimi就能接近任何一个新领域的初级专家水平。
“投喂”几十万字的教程,Kimi就能秒变德州扑克专家,提供出牌策略指导;上传一份百万字的中医诊疗手册,Kimi就能针对用户的问题,迅速给出诊疗建议。
华大基因CEO尹烨用过Kimi后不掩赞赏,“它可以帮我们处理以前大量的字符,比如50篇文献,全部做生物基因研究的,扔进去让它来帮我找,哪个是对的,哪个是一致的,哪个是相反证据。”
资本市场闻风而动,“Kimi概念股”暴涨一周。瞬间涌入的流量,让Kimi火到宕机数次,团队手忙脚乱,1天内5次扩容。
同时,Kimi掀起了长文本竞赛,百度、阿里等头部玩家连夜出手跟进,开放500万、1000万字的上下文,长文本成为新一代大模型的标配。
Kimi的另一重关键升级,盯上了AI搜索。
2024年10月,Kimi搜索版上线,搜索量是普通版的10倍,一次搜索即可精读超过500个页面。由于访问量过大,这一次Kimi又“崩”上了热搜。
其可以模拟人类的推理思考过程,多级分解复杂问题,执行深度搜索,并即时反思改进结果,提供更全面和准确的答案,帮用户高效完成分析调研等复杂任务。
产品负责人表示,“Kimi都搜不到的信息,大概率用户也很难通过传统搜索引擎找到答案。”
盯着通用泛化需求切入,不难发现,Kimi的主航线,是向超级APP进化。
力出一孔
杨植麟说,要聚焦只做一个产品,将它做到极致,将资源和力气砸在Kimi上。
在他看来,未来的智能产品,应该满足普世的需求,娱乐和生产力需求的边界其实并不明确。
他提到,一开始,月之暗面曾尝试过同步做几个产品,随后团队发现,多线并行的策略,在一定时期内有效,最后仍得聚焦。
“这两年,我们主动选择做减法。这是我们过去一年,比较大的lesson(教训)。”杨植麟说。
2024年初,月之暗面被曝发力出海,在海外推出两款新应用,分别为角色扮演应用Ohai,以及AI生成视频工具Noisee。当时的招聘信息显示,公司在招聘国内/国外效果广告设计师,或为布局海外广告平台铺路。
当年9月,公司决定停止这两款产品,转而专注Kimi。多位出海产品负责人亦传出离职创业消息。
公司称,两款产品仅为尝试,没有正式立项。
砍业务,本质上也是在控制人数。几家大模型创业公司里,月之暗面人数是最少的,目前在200人左右。
杨植麟表示,不希望把团队扩得那么大,那样会影响创新带来致命性伤害。“三个业务一起做,就活生生把自己变成大厂,没有任何优势。”
刻下,公司视提升Kimi留存,为最核心的任务。过去一年,其营销投放力度惊人。
2023年3月时,有投资人披露Kimi的平均获客成本为12元~13元/人,每天的获客成本,至少20万元。
1年以后,月之暗面在B站的CPA(用户转化人均成本)报价,已高达30元/人。
APPGrowing的数据显示,自2024年3月开始,几乎每月Kimi的广告投放都达到上千万元,10月达到2.2亿元,11月达到2亿元。
花钱如流水,月之暗面既要平衡投流、自然增长与商业化之间的关系,也要抓紧时间升级产品和技术。杨植麟曾说,希望在“爬楼梯”和“看风景”之间取得平衡,精力和优先级会放在“爬楼梯”上,言下之意,先做好技术研发而非尽快商业变现。
正是“作战”的关键时候,仲裁的负面风波,猛烈地扩散开来。
2024年11月,杨植麟、联合创始人张宇韬,被循环智能投资人在中国香港提起仲裁。理由为,杨、张等人在获得几家投资方的同意豁免书之前,就已启动融资并创立月之暗面。
事件中的金沙江创投主管合伙人朱啸虎,隔空打起口水仗,将矛头直指前金沙江创投管理合伙人张予彤,后者是月之暗面融资的关键推手。
12月6日晚,杨植麟发长文回应,强调已完成了离开循环重新创业的所有必要手续,授予张予彤股份,是对其作为联合创始人的支付对价。
截至发稿,该案件仍在审理中,尚未有结果。
回忆起当初创业的心情,杨植麟说,更多是兴奋、激动,因为“正在造一架火箭,每天在讨论往火箭里加什么燃料跑得更快,怎么样不让它炸了。”
接下来的路,不好走。庆幸的是,他和月之暗面,如此年轻,还有足够多的时间。
Lella95
用了感觉不咋样,碰到ds横空出世,后面的故事可能难以继续了
绿水舞忧
受DS影响估值翻倍都不只
熙梓
泡沫被轻轻的戳了下[捂脸哭]阿里刚刚估值40亿美金入股,不知道投资款打了没。如果没打还来得及,如果已经打了就只能先熬一熬了[大笑]
国服第一赵又廷
加油!中国科技会越来越好