AI时代的价值盈利①:生成式人工智能生态系统中的价值创造与分配

科技小草长长高 2024-08-20 02:10:15

「想象一个人工智能助手在一个由硬币组成的景观中导航」(Meta.ai图像生成)

介绍

最近在生成人工智能(GenAI)方面的突破抓住了人们的想象力,让我们看到了这项新技术的潜力。许多商业领袖立即看到了GenAI创造新价值的巨大机会,以及它同样巨大的潜力,可以颠覆他们业务的方方面面,甚至超越。在正在进行的关于GenAI的辩论中,所有人似乎都同意,不管一个人对这项技术的看法如何,没有人能够「观望」或放弃它。简而言之,迅速拥抱并学会使用人工智能,否则将面临过时的风险。

随着不同行业的企业急于将最新的人工智能/机器学习创新融入到他们的产品和工作流程中,领导者们越来越多地在他们的公司中提出关于GenAI的问题。我们遇到的最常见的问题之一是:「GenAI将如何改变我的商业模式,我应该如何考虑将GenAI从我的业务中盈利?」

当我们努力解决这个问题时,我们已经开始写下我们到目前为止学到的东西——分享对我们有帮助的概念和框架,希望对你也有帮助。请分享你的经验和观点——我们期待着向你学习!

在第一篇博客中,我们将探讨人工智能价值链,为什么每个领导者都需要了解今天为GenAI提供动力的生态系统,以及我们认为价值链的哪一部分将在未来产生最大价值。

GenAI和新的(类似的)技术生态系统

生成式人工智能在不到18个月前在市场上爆发,已经成为历史上采用最快的技术,轻松超越了最近的其他变革性技术,如智能手机、互联网和个人电脑。尽管所有的炒作和骚动都使GenAI显得特别而独特,但当前的采用趋势与我们过去看到的其他变革性技术采用周期一样,具有许多共同的社会、经济和技术特征,例如:

以高度颠覆性的技术为先锋,在经济和人群中广泛应用,导致市场迅速采用催生新的商业生态系统、供应链,创造新的市场刺激和加速下一波生产力、创新和技术发展

总的来说,这些特征创造了一种现象,有时被称为技术超级周期。

技术超级周期是指一段时间内快速的技术创新和采用,推动了重大的社会、经济和文化转型。在超级周期中,技术的突破性进步出现在多个领域,导致广泛的颠覆,新的市场机会和消费者行为的转变。这些创新往往相互促进,形成一种推动技术进步加速前进的势头。

虽然还处于早期阶段,但GenAI已经展示了上述所有内容,并以更快的速度和速度改变了市场和社会。因此,商业领袖掌握这种影响并使其商业模式适应人工智能世界的时间就更少了。

与过去的其他技术超级周期类似,GenAI正在迅速创建一个新的商业生态系统和供应链。这条新的人工智能价值链最终将涵盖每个行业的每家公司——从制造为人工智能模型提供动力的处理器的芯片制造商,到使用人工智能实现工作流自动化和增强服务的企业。每个商业领袖都应该了解这个新的人工智能价值链,因为它支撑着商业生态系统中每个参与者的战略关系、权力动态和商业战略,最终将包括他们自己。

今天的人工智能价值链

我们看到,人工智能价值链至少由七层组成,分为三个不同但(略有)重叠的层级。第一层指的是支持GenAI工作负载的创建和操作所需的基础技术和计算基础设施。这些市场更为成熟,具有明确的产品市场定价。

第二层包括人工智能领域的核心技术提供商——基本上是那些正在(或将会)为客户提供工具和服务的公司,以构建、培训、微调和运营他们的人工智能模型和支持人工智能的应用程序和服务。数据平台和提供商将发挥巨大的作用,因为对数据的需求来训练模型和实现先进的GenAI用例将为每个人创造爆炸式的需求和新的商业机会。这些都是新兴市场,快速的创新正在创造新的用例。一些早期的领导者正在整个生态系统中出现,但市场上还没有明确的赢家。

最后,第三层是指将在其商品和服务中使用GenAI的企业,以及将参与商业数据交换的公司,这些数据交换将为该人工智能生态系统提供动力。这些都是GenAI将影响的现有市场,但是(除了少数例外)GenAI将如何影响这些市场仍在定义中(例如,没有明确的产品市场定价),我们认为未来几年将会有很多实验和创新机会。

产业价值链

第一层:基础设施

芯片和硬件支撑着整个生态系统,指的是设计和制造为人工智能模型提供动力的专用微处理器和服务器的公司。将芯片和硬件简化为一层是一种简化,因为半导体设计和制造本身就是一个完整的复杂生态系统,许多公司在不同的市场领域参与和竞争。在本文中,我们将重点关注像英伟达和AMD这样的无晶圆厂芯片设计公司,因为我们相信这个市场的竞争动态将迅速发展,并对价值链的其余部分产生重大影响。

这一层目前由英伟达主导,占据了超过80%的GPU市场份额。由于高研发成本、知识壁垒以及台积电等尖端代工厂有限的制造能力,进入这个市场的门槛非常高。然而,随着合同制造能力的提高,人工智能价值链的这一部分将在未来几年内变得更具竞争力,主要来自三种新的潜在市场进入者:

1. AMD和英特尔等老牌芯片制造商将寻求在这一新的计算领域获得市场份额。

2. 新的初创公司(如Groq)为特定类型的人工智能处理设计专门的芯片。

3. 寻求通过垂直整合获得效率的超大规模企业。

由于其相似的经济特征,我们认为从长远来看,这个市场将吸引2-3家公司,就像个人电脑、服务器、手机等一样。我们还期望超大规模企业出于财务原因积极追求垂直集成,并将在其数据中心设计、构建和部署其加速计算硬件。

云基础设施提供商提供核心计算基础设施(计算、存储、网络)来训练、托管和运行推理、应用程序和服务。现有的超大规模服务商——亚马逊(AWS)、微软(Azure)和谷歌(GCP)——目前主导着这一层。这个市场的特点是极端的资本成本和规模经济,使得新进入者几乎不可能参与竞争。然而,新的技术要求,如电力、网络和冷却,以及有关安全、隐私(如GDPR)和数据+人工智能主权的新法规,意味着市场可能会沿着技术和地缘政治断层线破裂,可能会让新的实体获得市场立足点。新的市场进入者可能从三个方面出现:

1. 新的数据中心初创公司(Anyscale、Mangoboost、Lamdalabs等)专注于加速计算基础设施。

2. 参与人工智能价值链其他部分的公司(如英伟达、Meta)通过垂直整合寻求效率或新的市场机会。

3. 国家云提供商支持各国的数据主权/主权人工智能计划。

第二层:核心(AI)技术层

基础模型是指培训和服务基础人工智能模型的公司和研究机构,也是当今大多数市场炒作的主题。它可以被认为属于第一和第二层,因为人们可以认为它既是核心人工智能技术,也是参与价值链更高位置的公司的基础组件。这一层的参与者不需要介绍,OpenAI、Anthropic和MistralAI等公司似乎一夜之间就获得了普遍的品牌认知度。这个市场的多样性和活力令人难以置信,几乎每周都有新的进入者、新的模式和新的研究论文出现。

就像其下的云基础设施提供商层一样,这个市场是高度资本密集型的,具有非常高的技术壁垒。训练一个新的前沿类基础模型的成本不断增加,需要访问数十万个GPU和许多艾字节的数据。仅训练GPT-4的计算成本估计就超过1亿美元。Meta去年在H100 GPU上的巨额投资价值数十亿美元,进一步表明在这个市场的前沿进行创新所需的成本不断上升。此外,监管审查似乎正在加强,对数据隐私、安全、安全和主权人工智能的担忧迅速引起了全球监管机构和政界人士的关注。

考虑到所涉及的市场动态,尽管市场目前非常活跃且高度分散,但我们预计市场最终会稳定下来,并整合成几个重要的参与者(类似于操作系统层)。然而,市场和技术仍处于起步阶段,我们正在看到许多不同的技术、架构和业务向量上的快速创新。(例如,多模态,「代理」工作流,「通才」与「专家」模型,封闭与开放源码,大型与小型模型,等等)。我们预计,至少在可预见的未来,爆炸式增长的时期将持续下去,直到市场开始选出赢家。届时,我们预计这一市场将迅速整合。

从盈利的角度来看,目前这一层最关键的商业动态之一是OpenAI的GPT或Anthropic的Claude等闭源模型与Meta的Llama或Mistral 8x22b等开源模型之间的较量。虽然我们不相信开源模型会完全取代ChatGPT——就像Linux没有杀死Windows一样——但这些开源模型将以多快的速度得到改进,并被企业采用以创造新的价值,这将是决定GenAI如何变现以及这些市场将如何形成的一个重要因素。

数据+人工智能编排是指提供平台和工具的公司,使组织能够有效地管理端到端的数据和人工智能部署过程,从数据清理和增强(例如,标记和嵌入)到模型培训,再到部署和运行推理的微调。通过利用这些平台,组织可以简化工作流程,确保数据质量,并加速GenAI应用程序中准确可靠的推理操作的开发。与第一层(芯片和硬件)一样,将该市场简化为单层是一种总体简化,因为该市场与许多相邻的技术领域重叠,具有丰富而复杂的业务生态系统(例如数据分析,数据工程,安全,可观察性,DevOps等)。这一市场仍处于萌芽阶段,在某些情况下,有一些产品市场定价非常适合。然而,由于基础模型和实现技术仍在快速发展,潜在的许多未被发现的杀手级用例尚未在这个市场上出现。

数据和人工智能编排

尽管仍处于早期阶段,但已经出现了几类工作流,它们似乎具有持久力,并且越来越重要。它们是:

1. 数据准备和增强是指准备数据以供机器学习和大语言模型在模型训练、模型微调和提示工程中使用的工作流程和操作。它们包括传统的数据工程工作流,如ETL和更多的特定于AIML的操作,如数据标记、注释和向量嵌入。

2. 模型管理和微调是指微调预训练的大语言模型和系统以测试、定制、管理和部署这些模型进行推理的工作流和操作。微调可能包括数据管道,通过精心策划的数据集对模型进行微调,人在环反馈技术,如RLHF(从人类反馈中强化学习),甚至更多的实验技术,如RAFT(检索增强微调)。帮助公司发现、测试、定制、管理和部署大语言模型的服务被称为「AI Studio」和「Model Garden」。一些成熟的服务已经进入市场,包括Huggingface、Azure OpenAI Service、AWS Bedrock和GCP VertexAI。

3. 上下文优化指的是工作流程和操作,旨在增加输入令牌(称为「提示」),以提高推理性能。它包括一些简单的技术,比如为大语言模型(例如,Prompt Engineering)提供更好的(或多个)提示,以及像RAG(检索增强生成)这样的高级工作流。RAG是一个预处理系统,旨在使用数据库中的其他令牌「增强」用户的提示,以改进大语言模型推理响应。上下文优化是一个快速发展的领域,有很多活跃的研究,我们期望在未来有许多不同的技术和实现,在各种用例的应用中。

4. AI工作流编排是指管理和协调上述1-3中提到的工作流和操作,管理AI服务的部署,并将其集成到应用程序中的平台。研究人员和早期采用者已经表明,提供高质量的上下文感知推理所需的操作和编排开销非常高。我们相信,在产品中部署和维护高质量模型的成本和复杂性将为公司创造新的机会,帮助客户解决这个新出现的问题,类似于现代软件开发如何产生CI/CD和DevOps。

现代DevOps生态系统

就像现代的DevOps生态系统一样,未来可能会有几十家甚至几百家公司参与到这个市场中来。由于与安全、数据平台和DevOps等已建立的生态系统有着密切的技术联系和依赖性,这个市场也正在形成一个令人难以置信的竞争空间。我们预计,如今这些市场上的许多现有公司将扩展到这些新兴用例的服务中,与许多新的「GenAI Native」初创公司竞争,这些初创公司已经在极短的时间内获得了令人难以置信的势头。(例如:Huggingface, Humanloop, Cohere, Together。ai、Pinecone、ScaleAI、LabelBox、lean、Appen等等。)

数据提供者是管理、生成数据并将其变现的公司,这些数据用于模型训练、微调、强化学习和高级上下文优化技术(如RAG)。它们还包括提供核心服务以促进数据生产、清理、获取和交换的公司。从技术或工作流程的角度来看,这一层和最后一层之间的分界线有点模糊,因为AI/ML中的数据至关重要——几乎不可能只讨论其中一个。然而,从商业角度来看,这些是不同的市场,因为数据市场不同于处理数据和编排人工智能工作流的市场。数据市场已经很成熟,但随着人工智能/机器学习对数据需求的爆炸式增长,数据市场也在不断发展并变得越来越重要。「人工智能数据」最好被视为当前数据市场的大规模用例扩展。这种扩张可能会带来许多新进入者,与以人工智能为中心的新数据类别中的成熟公司竞争。这一层的参与者将分为以下四类:

1. 现有的数据提供商和经纪人——从彭博和Revinitiv这样的金融数据巨头到Liveramp和Experian这样的数据经纪人。

2. 新的特定于人工智能的数据创造者/提供者——例如,为人工智能和机器学习用例创建数据的大规模人工智能和合成数据公司。

3. 提供数据交换服务的公司——示例:数据洁净室、数据存储库、数据交换服务和数据市场

4. 「非传统」数据提供者——人工智能/机器学习是由数据创建和驱动的,每个公司都可能成为人工智能/机器学习用例的消费者和数据提供者。

这一层创新和扩展的时机已经成熟。上面提到的最后一个类别可能会改变游戏规则,因为企业对AI/ML的推动将提高每个公司捕获和利用其数据的能力。每家企业不断增长的数据和人工智能复杂性将反过来创造更多的数据需求。我们相信,企业将以比现在更高的速度使用第三方数据,为企业人工智能提供动力。他们收集和产生的数据反过来又会成为其他企业越来越有价值的商品,为不同的公司创造新的市场来分享和变现他们的数据。

第三层:应用程序和服务

应用程序——这一层指的是公司构建应用程序,利用人工智能价值链的其余部分为最终用户/消费者/企业提供价值。这些可能是现有公司将GenAI注入他们的工作流程,以打开新的用例或为客户提供新的价值,或者是希望通过以AI为基础「构建更好的工具」来颠覆现有公司的新公司。今天,这个细分市场的特点是激烈的竞争和大量的炒作,许多公司大量投资将人工智能功能添加到他们的工作流程中。虽然一些企业的定位是通过他们的人工智能战略提供长期的、可防御的价值,但其他企业可能很难找到可持续的竞争优势,尽管会产生巨大的成本。

尽管我们仍处于创新周期的早期阶段,但在应用程序领域已经出现了许多早期产品。在企业中,这些人工智能驱动的服务主要表现为智能聊天机器人、虚拟助理或AI协同,指导用户完成他们的数字体验并提高生产力。在消费者领域,我们看到类似的聊天机器人/虚拟助手应用程序用于文本生成和知识检索(如ChatGPT),以及更多实验性的内容生成工具,如DALL-E、Midjourney和Suno。这些早期的应用程序涵盖了非常广泛的领域,从客户服务和个人生产力到医疗保健、媒体、娱乐和广告。它强调了人工智能能够彻底改变个人和组织与技术的互动方式的可能性。随着GenAI技术的改进和成本的下降,新的用例将继续出现,这无疑会让每个人都感到惊讶。

服务是指专业服务公司和系统集成商,帮助他们的客户规划、构建和维护他们的人工智能基础设施或应用程序。现有的全球si和咨询公司,如麦肯锡、波士顿咨询集团、德勤、埃森哲和许多其他公司,已经建立了大量的能力来帮助客户驾驭这种新技术并加速采用。这一层的市场机会的扩大,将会随着下一层的人工智能用例的扩大而扩大。随着GenAI技术和单位经济的提高,它将为现有和新的企业创造新的用例和更多的机会来参与这个市场。

最后的想法

生成式人工智能和其他人工智能技术正在成为21世纪最重要的技术创新之一。它们预示着一个新的技术超级周期,它将改变我们用软件和计算机所能做的事情,重新定义我们如何与技术互动和交互,并有可能为个人和企业带来新一轮的生产力提高。这种转变正在以惊人的速度发生。它将颠覆每一个行业和企业,影响公司创造和提供商品和服务的方式以及他们的商业模式。随着时间的推移,人工智能将成为每家公司商业战略的关键。因此,商业领袖需要了解人工智能价值链,以了解这项新技术的经济动态,随着时间的推移,每家公司都将作为这个新生态系统的供应商和消费者参与人工智能价值链。

人工智能价值链仍然是新的,随着基础设施和底层技术基础的巩固和建立,更高层次的价值链正在出现。虽然现在还为时过早,但我们相信未来几年将出现以下几个新兴趋势:

由于高资本成本、技术协同、强大的网络效应和规模经济,在较低层次进行垂直整合的压力巨大。超大规模企业(AWS、Azure、GCP和Meta)将在这个新的生态系统中占有巨大的地位,因为它们拥有资金、专业知识和动力,可以垂直整合价值链的大部分。许多这样的市场很可能是「赢家通吃」,美元和市场份额将集中在两三个赢家身上。人工智能将迫使每家公司升级其数据基础设施和能力。没有数据战略就没有人工智能战略。数据对于每个人工智能用例都是必不可少的,从模型训练到调优再到上下文优化。处于数据前沿的公司将在构建和利用人工智能系统方面处于领先地位,而那些拥有帮助其他公司规划、构建和运营其数据战略的专业知识的公司将有机会增加(并变现)大量的附加值。人工智能将增加数据的经济价值,扩大市场。随着企业学会将更多更好的人工智能纳入其业务,它们(必然)会更善于捕获和使用业务产生的数据。数据的爆炸式增长将与数据需求的爆炸式增长相匹配,因为每家公司的人工智能系统都将需要更多的数据来进行培训和环境优化。这种供需动态将刺激企业购买更多数据,并允许更多企业将其数据变现。假设我们能够可靠地克服安全、隐私和治理障碍,数据市场将有机会在未来几年实现跨越式增长,因为每个公司都有可能成为这个市场的数据买家和数据提供者。说到底,盈利和贡献利润仍然是关键。随着人工智能技术的成熟,以及市场将重点转向大规模运营和运行推理,在考虑人工智能部署时,商业模式、变现策略和单位经济将成为越来越重要的考虑因素。

来源:Medium

作者:Abde Tambawala

翻译:Fred

0 阅读:0
科技小草长长高

科技小草长长高

感谢大家的关注