ChatGPT的崛起虽意外,却也在情理之中。自GPT—3问世时,我们就已预见到大模型的重要性,只是难以确定其突破时机。2023年,ChatGPT的出圈对整个产业产生了巨大的推动作用。技术进步可能是线性运动,但信心则是跳跃式的。在技术未达到临界点之前,公众对其几乎没有信心。
因此,此轮风暴主要源于信心的转变,而非技术上的重大突破。以AI(人工智能)绘画为例,该技术早已存在,但当时人们对AI作画兴趣寥寥。2023年,即便我们不主动提及,大家也会追问,渴望了解AI作画。
第四范式拥有一个由100多名研究员组成的团队,类似于公司的“达摩院”。对我们而言,大模型是一个不能错过的方向。
自2018年Google(谷歌)推出BERT模型起,我们便着手相关工作。尽管BERT当时存在局限性,但GPT—3的出现为我们指明了技术发展的明确方向。我们在此过程中的投入与2023年有所不同,特别是在技术临界点突破后,团队的士气和信心大增。
信心问题一直困扰着我们。2022年若推出“式说”1.0和2.0版本,市场接受度恐怕不高。因此,尽管我们长期储备了大模型技术,却未给予足够重视。技术临界突破后,我们立即着手产品化,于是在2月和3月迅速推出了“式说”1.0、2.0版本。
在此过程中,我们面临的主要挑战是“可控性”问题。我们需要明确哪些事是可控的,哪些是不可控的,同时探索客户对于可控与不可控范围的接受度。以AI功能实现为例,即便准确率高达99%,若无法满足用户的100%要求,便无法使用。或者至少应确保在指出错误时,AI能够进行自我迭代与修正。
对于大模型能力的涌现,我们并不感到意外或激动,而是视为理所当然。我们对自身大模型的评价是“理应如此”。因此,在这波大模型投入上,我们未设明确上限,只要现金流允许,就会增加投入。目前,我们最高能产出千亿(参数)规模的模型或产品。
目前外界将AI分为1.0和2.0阶段。过去的AI,是点上的AI,在参数规模达到1亿或10亿时便被广泛接受。而现在热议的AGI(人工通用智能),是面上的AI,其模型需达到一定参数量级,方能展现可接受的能力。例如,参数规模低于100亿的大语言模型,其能力难以被认可。
过去我们寻求的AI应用场景,如搜索引擎、资讯推荐、金融交易等,均需具备足够大的价值,因为以往的模型仅适用于特定场景。如今,多模态大模型能力可成为底座,支撑多个场景。这就意味着,模型研发从以往注重投入产出比,转变为现在全面升级换代。
过去点上的AI无法脱离软件单独存在,如抖音的推荐算法必须嵌入APP中才能为用户服务。如今,AI技术带来的巨大机遇在于,它有望推动整个软件产业,包括to C(面对企业)和to B(面对消费者)领域再次升级换代。
在大模型的实际应用上,我一直认为其将首先变革to B行业。由于B端企业软件的起点相对较低,可改进空间更大。这就像二维码支付在中国迅速普及,但在信用卡业务高度发达的美国却难以推广一样。
中国的to C软件在过去十余年里已发展至较高水平,而B端企业软件更注重功能且交互门槛较高。AI大模型引入的新交互模式(如对话框式),有望创造出交互简洁、功能全面且能自我优化的新型软件工作流,提升B端软件的用户体验。此外,在开发层面,传统的B端软件采用菜单式开发,功能更新周期长,而AI在改写数据和API(应用程序编程接口)方面的效率远超以往,从而将软件迭代周期缩短至以天为单位,无论用户体验,还是开发者体验,都得到了飞跃式提升。
ChatGPT的出现提升了客户对AI的接受度和信心,也推动市场的发展。我们正与各行业客户,包括金融、能源、运营商、零售和医疗等,共同推动技术产品的实际应用。同时,技术的迅速发展也提高了我们吸引新客户的效率。
关于大模型的商业模式,我认为最适合的盈利点是算力。AI算力的重要性不容忽视,例如,每次访问ChatGPT都会消耗一定的算力资源,这种按使用量计费的模式非常合理。关于to C领域,我们虽无明确商业计划,但会持续保持开放的态度。
近期,我们这家to B科技公司的工作模式愈发趋向于互联网企业的风格。过去在互联网公司,快速迭代是常态,每天都会创新并实验,依据结果持续优化。尽管第四范式是一家高科技企业,主要从事to B业务,但我们的迭代和反馈周期正逐渐加快。在to B软件企业中,我们每年更新两个大版本已算迅速迭代。
过去,每个月甚至每天迭代对我们而言是难以想象的,然而,在ChatGPT的交互模式影响下,我们的产品和技术研发流程已经发生了深刻变革。传统上,研究部门开发的算法需经历工程化、产品化到解决方案的漫长过程,至少耗时一年,甚至两到三年才能推向市场。而现在,借助AI的力量,我们研究团队的成果能在一两天内迅速进入产品阶段。
团队如今的工作体验与以往截然不同。以前,我们百余人的研究团队在外界鲜为人知,因为研究成果至少需要一年才能实现商业价值,这期间,我们只能自我激励。但现在,新成果一旦出现,就能迅速被大众看见并对产业产生影响。我们很享受这种类似互联网公司的运作模式——快速迭代、不断试错,并与客户共同打磨产品。这不仅提升了产品能力,还让我们与客户更紧密地协作,共同进步。
关于公司的发展愿景,早在创业初期,我便与其他创始人探讨过这个话题。我们期望人们或许不熟悉戴文渊这个名字,但提起第四范式,却人人皆知,至于创始人身份,或许需要查阅一番。许多海外企业的创始人已逐渐“隐身”,例如IBM和微软,即便创始人不再活跃,公司依旧蓬勃发展。虽然创业公司鲜有能达到此境界者,但我们寄希望于第四范式有朝一日能实现这一目标。