2023年如火如荼的AI竞争,仿佛一个残酷的竞技场,有的企业凭借技术创新和商业模式的突破,占据了新时代的桥头堡;有的则因为资金与实力的不足,成为了功未成名未就的“前浪”。
第四范式就是这样的企业,其高开低走的经历让很多人大跌眼镜:一方面似乎拥有强大的技术实力和投资背景,另一方面却面临着巨额亏损和上市难题。
自2021年8月首次递表至今,第四范式已经四次递交上市申请,但其这次面临的窘境更甚于之前三次。
贴上“中国决策类AI独角兽”标签的第四范式,曾吸引了众多知名投资者的青睐。其中,不仅有红杉资本、腾讯投资、高盛集团、博裕资本、李开复的创新工场等国内外顶尖的投资机构,甚至连国内六大行,在使用过他们的系统之后,也成为了他们的股东——在2018年的早期投资中,第四范式获得了中国工商银行、中国农业银行、中国银行、中国建设银行、交通银行、中信银行等国有商业银行的共同投资。
这样的阵容让人不禁好奇:火热的赛道,顶级的投资阵容,起个大早的第四范式为何至今未赶上集?
连续三年亏损超过40亿元,并在债务压顶下面临上市对赌的困境,第四范式已经走到了悬崖边缘。
在第四范式的众多投资者中,有一个人格外引人注目,那就是创新工场的董事长兼首席执行官李开复。
李开复不仅是享誉全球的AI专家,并且还在2013年AI潮起之后,成功投资了一系列AI公司。
李开复旗下的风投公司——创新工场,在2010年代投资了数百家成功企业,其中不乏当时出众的AI公司,例如旷世科技、第四范式等。他们中的大部分,都已经融资到D轮或更高,并维持了快速的用户增长,和较高的市场占有率。
创新工场也是第四范式最早的投资者之一,从2016年开始就参与了第四范式的A轮融资。然而,如此注重AI的创新工厂,还是没想到自己踩了个大坑。
面对如今第四范式的种种失利局面,人们不禁怀疑:难道当初李开复真的看走眼了吗?
其实,李开复的决定,从技术的角度来看,并没有太多可以指摘的地方。
在人工智能、机器学习方面有着深厚造诣的李开复,曾经说过:“深度学习是一个承载其他技术的平台”,因为深度学习可以与其他技术相结合,实现更多样化和更高级别的人工智能应用。
这里的“深度学习”是一个广泛的概念,它包括了迁移学习、环境学习、自动强化学习等方面,而第四范式恰好在这三个子分类上,有着领先的技术积累。
第四范式联合创始人、首席科学家陈雨强,是国内最早从事强化学习与环境学习研究的专家之一,其研发的智能决策技术,可以在动态环境中持续、快速找到最优决策,并在供应链、制造、金融等领域进行了实践应用。主持百度凤巢和今日头条的智能广告推荐系统的经历,为其创业第四范式提供了颇有含金量的背书。
也许正是由于陈雨强的技术背景,让深谙AI发展路径的李开复,最终选择了第四范式。
然而,李开复也深知,面对进化飞速的AI技术,仅靠深度学习这一招,是战不了未来的。为此,创新工场在今年提出了与AI 1.0相对应的“AI 2.0”概念。
3月14日,在北京创新工场总部举办的 “AI 1.0 到 AI 2.0 的新机遇”趋势分享会上,李开复指出:“在深度学习的重大突破之后,AI 已经来到从 1.0 迈入 2.0 的拐点。”
在李开复看来:
“‘AI 1.0’的瓶颈就在于,其无法突破数据集和诸多模型各成‘孤岛’的局面,进而缺乏纵效。”
因此,AI 1.0无法像互联网时代的 Windows 和 Android 一样具备规模化能力,来降低应用开发的门槛,打造完善生态链。这也就是为什么,大部分的 AI 1.0 企业投入大笔研发经费但仍然长年亏损的原因。
在李开复和创新工场看来,AI 2.0技术克服了AI 1.0的单领域、多模型的瓶颈,可以用无需AI标注的超级海量数据,去训练一个具有跨领域知识的基础大模型(Foundation Model)。这样的大模型,能通过微调等方式,适配和执行五花八门的任务,真正有望实现平台化的效应,进而探索创新应用的商业化机会。
实际上,在创新工场投资第四范式和旷世科技的时代,大部分人工智能企业,都还处于AI 1.0的阶段,可以说两者是时代弄潮儿。然而,随着时间的推移,它们选择的技术路线未能实现商业闭环,后来也未能顺利地实现转型。这导致两者均多次冲刺IPO失败,并且亏损情况十分严重。
刚上线的『零一万物』网站,尚处于“毛坯”状态
7月3日,李开复亲自操刀的AI 2.0公司——『零一万物』上线,其将自研大模型,并自建数千卡GPU集群进行数据训练与推理,在上线之日,其大模型的参数规模已经接近300亿。
第四范式4冲IPO未卜与创新工场亲自下场搞大模型,都是AI赛道必须改弦更张、调整技术路线与商业模式的标志。
在这种不可逆趋势下,第四范式向IPO发起的第四次冲击,希望是比前三次更大呢,还是更小呢?
与2010年代大部分选择感知类、认知类AI,或机器视觉技术为主的AI企业不同,第四范式选择的,是较为独特的决策类AI领域。
所谓决策类AI,指的是对大量数据的深度挖掘、分析,从中总结或统计出规律、趋势,并以此提供更高效的预测和决策。
例如,决策类AI可以根据用户的历史行为和偏好,推荐最适合用户的商品或服务,也可以根据市场情况和竞争对手,优化商品的定价或库存,以及用于银行提高反欺诈识别准确率。实际上,陈雨强之前在百度凤巢与今日头条的产品贡献,就是商业决策类AI。
在此之前,许多大企业虽然做了很多类似的小系统,但是不能很好地协调和管理。他们想要一个大平台,可以把所有的小系统都连接起来,做出更好的决策。但着并非易事,因为各个系统的数据难以统一,并且已有的系统算法不容易改变。
而第四范式的CEO戴文渊,正是看中了这点,才决意在to B端的赛道上发力,并研发出了相应的平台——“先知”系统。
显然,在2010年代末,这是个技术难度较高但竞争较少的赛道。
第四范式所在赛道的难度在于:决策类AI需与企业的具体业务、场景深度绑定,而每个客户的业务场景、数据特征、性能要求等都不尽相同。
因此第四范式需要不断进行定制化项目的研发和外包,这就在无形中,造成了其高昂的研发成本,也是其不断亏损的症结所在。
例如,第四范式为中国银行提供了一个定制化的风险管理系统,提供了包括精准营销、智能反欺诈、智能反洗钱等一体化整体解决方案。
但由于中国银行的业务复杂多变,第四范式需要根据不同的金融生态、企业类型和风险评估方式,来一次次进行调整和优化,从而耗费了大量的资金和研发力量。而这种定制化项目的研发,对第四范式而言,成了一种噩梦般的“无底洞”。
根据招股书显示,第四范式的研发费用在2018-2022年占收入的比例分别为151.2%、90.6%、60%,62%,53.7%,基本上可视为逐渐下降,但相较之下,百度、华为、阿里、腾讯四家染指AI的巨头的研发费用,占收入比例分别为18.22%、15.92%、8.46%、8.08%,可见第四范式的技术转化率是相当低的。
这是因为,在目前的AI商业化赛道,生态各方各司其职。大体来说,可以分为如下三种:
1、类似于“4S店”的模型服务网络,主要在垂直领域,为企业提供SaaS类型服务;
2、相当于“整车”制造平台的应用模型产生平台,以模型生产线作为服务,为每个场景精调模型。例如阿里云的机器学习PAI平台、百度的飞桨平台等;
3、相当于“引擎”设计的基础模型生产线,如澜舟科技的孟子预训练模型平台,MiniMax的通用大模型引擎平台;
阿里提出的MaaS服务将成为大模型平台标配
但第四范式高度定制化的“先知”平台,却不属于上述三种中的任何一种。
打个比方,第四范式提供的更像是一种“定制化的引擎+”,也就是不仅提供了基础模型、算力平台,还提供了高度定制化的算法核心。用第四范式自己的说法,就是“已打造覆盖从算力、操作系统、生产平台到业务系统的全栈AI产品矩阵”。
然而,第四范式在选择自己的技术路线与商业模式组合时,并没有预料到其中的商业风险。
与决策类AI相比,视觉、语音、语义这类AI应用,则可以基于统一的数据来训练部署,因为人类的视觉系统、语音、语义系统,在数据方面一定的通用性和规律性。这就意味着,人们可以利用大量的公开数据或标准数据来训练通用的模型,然后根据不同的应用场景进行微调或适配,就可以实现较好的效果。
然而,决策类AI想要捕捉的,却不是语言、视觉信息这些具象的东西,而是不同决策场景下抽象的“特征”、“规律”。
这些特征和规律往往是特定于某个领域或任务的。
因此,统一的数据集和模型难以涵盖所有的决策情境,在这种情况下,决策类AI就需要根据具体的应用场景进行个性化的数据收集、模型设计和训练。
而这样“隔行如隔山”的特点,将一个个行业、企业,隔绝成了封闭的“AI孤岛”,也使得第四范式花费高昂成本研发的定制化方案,难以在别的场景复用。这颇有些像是SaaS时代之前的本地化部署服务。
由于定制化研发所带来的高昂成本,加上大客户回款周期长、维护成本高等原因,第四范式一直处于亏损严重,现金流紧张的状态。而这样的情况,也造成了其前三次上市的失败。
经过了一系列屡败屡战的尝试后,痛定思痛的第四范式,通过优化股权结构、拓展海外市场等措施,一定程度上逆转了之前的颓势,其2022上半年的净亏损,也由同期的5.84亿下降到了2.2亿。
第四范式CEO 戴文渊曾称第四范式给AI带来了一场质变。可没想到,就在其欲重整旗鼓,第四次冲击IPO时,随着chatGPT的横空出世,一切都改弦更张了。
高度通用化、平台化,且具备多模态功能的生成式AI,与第四范式定制化、应用场景受限,的决策类AI相比,显然有着更强大的生命力和更广阔的商业前景。
这样的AI,也更接近于前面李开复所提到的“AI 2.0”的概念。
高度通用化的生成式AI,可以适应多种数据或内容的形式和风格,而不受限于特定的领域或场景,而这是以往的决策类AI所做不到的。
在生成式AI强大的影响力面前,偏执的戴文渊,也不得不做出了“妥协”,在其最新的招股书中,竭力地渲染自家的生成式AI产品Sage GPT,并寄希望于炒作“类GPT”的概念,来获得上市的机会。
其在最新的招股书中如是介绍:
Sage GPT具有多模态互动能力及企业级人工智能工具特性,其重新定义了终端用户的员工与业务系统的互动方式——即SageGPT能够连接终端用户的现有业务系统、人工智能应用及内部数据库;
由此可见,任何一种技术,要想真正被市场接纳,不仅取决于其是否“强大”、“先进”,而更取决于其是否对客户群体展现出一定的“友好”性。
就这一点来看,深陷决策类AI泥淖的第四范式,起了个大早,没赶上早“集”,晚“集”的游戏规则又变了。在4年前,第四范式算是AI潮头弄潮儿,而现在,却是在Chat GPT的大潮后面亦步亦趋。
拖到2023年,优势变劣势,第四范式第4次冲刺IPO,还能成功吗?