“思想的边界,往往就是语言的边界。”著名哲学家维特根斯坦说。
一场堪称“语言边界”的革命浪潮呼啸而至,俨然完成了对世界的一次“技术突袭”。短时间内上亿人对话的ChatGPT“暴力出圈”,成为现象级爆款产品,令世界侧目。今年3月访问量16 亿次,比1月时访问量(5.9亿次)多了近3倍。
图源:Pexels
GPT是英文generative pre-trained transformer的缩写;ChatGPT,可理解为预训练语言生成模型。有微软参与投资的openAI公司通过深度神经网络训练出来的GPT-3.5大模型,拥有1750亿个参数,45万亿个语言标志(token)。
GPT-4推出,微软几乎重新定义了软件服务。据报道,继摩根士丹利首家正式接入GPT-4后,彭博则训练出BloombergGPT,一个据称有500亿参数、基于BLOOM模型的金融大语言模型(LLM for Finance)。普华永道宣布将投资10亿美元采用大模型技术。
GPT时刻来临,持续引领全球科技企业与之共舞。一个极具戏剧性的细节,由Facebook更名不到一年多的Meta被华尔街金融分析师调侃,他们喊话扎克伯格:Meta或需要更名为MetAI?此外,Google公司随即推出Bard要对抗ChatGPT,马斯克更是心有不甘地喊话:人工智能“有风险,要缓缓”,旋即成立自己的人工智能公司X.AI,买了1万个GPU对抗ChatGPT。
可以看出,GPT点燃了人们对人工智能的热情,硅谷正在掀起一场大模型风暴,这场风暴正在引爆通用AI革命。沉寂已久的中国科技企业和机构对参与这场通用AI革命也表现出极大的热忱。
统计显示,目前中国公司和机构参与类型有四:一是百度、阿里、腾讯、字节跳动等互联网大厂;二是科技企业,如华为、科大讯飞、第四范式、商汤、旷世、三六零、创维等;三是新创企业,如百川智能、光年之外、智谱华章、出门问问等清华系A轮的公司,刚刚起步,百业待举;四是政府或高校背景的研究机构,如北京的智源研究院、杭州的之江实验室、深圳的鹏程实验室等。
学界对本轮AI创业浪潮则保持了很大的警惕与审慎。计算机科学家、自然语言模型专家吴军直言,“ChatGPT从历史上看其实不算是一次技术革命,它影响到的都是那个比较懒的人,如果要问这里面有什么机会的话,坦率来讲,你没机会,因为太耗资源了,你耗不起。”
联想到与当年追逐半导体及芯片一样,外界担忧模型大跃进,“一哄而上”可能会陷入同样的覆辙。与通常的认知不一样,“人工智能与半导体、芯片不一样,并没有一哄而上,而是进入或投入得还不够,许多人只是喊喊口号而已。”人工智能领域天使投资人曾良对财视传媒如此表示。
图源:Pexels
如果曾良的判断是对的,那么竞逐大模型的竞争显然还没有开始。眼下还处于训练打磨内功的时候。
5月4日,浸润于人工智能多年的百度创始人、董事长兼CEO李彦宏总结成果,“文心一言内测一个多月,就完成了4次大的技术升级,大模型推理成本已经降到了原来的十分之一,或者说推理性能提升近10倍。当别人刚刚开始思考如何进行训练的时候,我们已经在推理上冲出了很远”,“今天的人工智能领域,竞争比以往任何时候都更加激烈,我们面临的挑战也是前所未有的。”李彦宏判断。
谈及与ChatGPT的差距,李彦宏称,“大约是两个月,但说实话这有点断章取义,我后面紧接着还说:这不是重点,重点是这两个月的差距我们要用多长时间才能赶上,也许很快,也许永远也赶不上。”不久前大佬们对此还不乏火药味的争议,“现在我对行业的观点‘静默’了。”前搜狗CEO、五季智能创始人王小川对财视传媒表示。
王小川是诸多参与人工智能创业的一个代表,在他身后有着无数互联网大佬与风投机构已经躬身入局,他们正在稍许熙攘的人工智能赛道中匍匐前行,比如周鸿祎、王慧文、王兴、李开复等,他们的眼中有光。
与光同尘。GPT的下一站在哪里?未来中国企业谁会在竞逐大模型中脱颖而出?能否追上OpenAI公司的领先优势?竞争的胜负手是什么?诸多问题待解。
一、算力差距到底有多大?
对于中国企业来说,算力是制约发展大模型的一个瓶颈。算力会否是竞逐大模型的一个胜负手?
“百度有自己的多个数据中心,有自研的芯片,有自己的深度学习框架和大模型”;“算力,算法,数据都有”;“我个人看好百度和阿里,对AI投入和研究早”,一位接近百度的分析人士对财视传媒表示。
相比之下,眼下有许多企业都表示有模型要发,算力从哪儿来?“企业中有过硬的千亿参数大模型的是百度,阿里,华为。ChatGPT火了之后,好多企业都说自己有模型要发。我从旁观者视角看挺奇怪,这也能速成?况且训练一次也很费钱。只有大公司或者大公司资金支持才能负担得起。”上述分析人士表示。
据了解,对算力的需求目前可分为训练算力和推理算力,其中训练算力需求更高。据COCO知研分析,以大语言模型为例,按照英伟达最先进芯片A100计算能力的测算,可能需要6000张芯片同时运算,才能符合ChatGPT的训练要求。
在COCO知研看来,算力的硬件规模投资达到1亿美元,整个数据中心还需要推理能力和服务器,规模达到约10亿美元,只有大型互联网公司才有能力承担这样的投资。这也意味着未来大概率不会诞生像ChatGPT这样的AI人工智能初创企业,壁垒变得很高,小公司无法参与。
没有算力,可以去买?“算力不能保证我们能够在通用人工智能技术上领先,算力是可以买来的,创新的能力是买不来的,是需要自建的。”李彦宏日前表示。而在曾良看来,大规模的算力不一定买得到。他认为李彦宏是想表达创新更重要,这没什么问题,“算力是可以买得到,但要有足够多的钱和时间去买。”
曾良认为,在使用通用人工智能技术方面,目前各家企业与OpenAI之间的差距相当大,这是算力、算法和数据综合的结果。虽然算法方面没有太大的差距,但算力差距确实摆在那里。“要买3万张A100GPU也挺难的,这些东西咱们不能做自主生产,对吧?”曾良如此表示。
一个大背景是,在芯片领域,美国正在持续加大对中国的制裁力度,2022年即禁止向中国出售英伟达高性能芯片A100和H100。
不过一些机构也做了一些储备。据不完全统计,互联网大厂购买芯片的预算均在20-40亿美元之间,是过去三个月GPU抢购主力,英伟达A800、H800公开市场供货大多数被这几家瓜分,其中字节出手最快、买得最多。此外,第四范式、旷世通过各种方式抢购了数千张英伟达A100或同等算力的卡,商汤有一定积累,依图刚刚融到约20亿人民币用于购买硬件。
如果不完全依赖英伟达的先进GPU芯片,就要支持CPU、GPU、ASIC、FPGA等多种芯片的混合部署。从国家维度来看,算力的差距并不大,“最近我看到一个数据,说全球算力规模,美国占34%,中国占33%,算力差不多。”李彦宏说。这是否意味着中国创业者或企业家不必对算力差距抱有过多的焦虑?
当下,许多初创企业想要成为中国版的OpenAI,相比之下,市场更看重大模型,这些模型往往由巨头或者巨头投资的“代理人”提供,如谷歌投资的美国独角兽公司Anthropic。有分析认为,一些初创企业并非就没有出路,比如大模型中裁出小模型,锚定垂直领域,这样不仅可以应用于特殊场景,还可以解决算力问题。
二、垂直领域应用大有可为
曾良对人工智能有着非常清晰而深刻的认知:“你要把它看成像电一样,通用人工智能以后会是重要的基础设施,会重构各行各业。”曾良的观点与著名科学家吴恩达的看法可谓一脉相承,“机器学习和人工智能就像是电和火,是21世纪最重要的基础设施。”
前不久出台的《生成式人工智能服务管理办法(征求意见稿)》,预示了中国大模型的发展方向。如果说人工智能就是“电和火一样的基础设施”,这意味着千行百业都将会获得AI加持。
互联网、消费、实体经济中,蕴藏和生成着丰富的数据量,垂直领域模型的训练成本不断降低,迅速降低了人工智能使用门槛。不过在分析看来,互联网大厂更容易受到强监管,新创企业更能安全地赋能实体经济,获得政府扶持。“我更看好我们一直参与投资和推动的第四范式。”曾良表示。
第四范式从创业之初就专注于企业服务赛道,往往服务客户生产经营最核心最关键的场景,目前在金融、零售、物流、能源、轨道交通、医疗、工业制造等诸多领域有100家标杆客户(世界500强或上市企业),标杆客户年对年收入增长迅速,客户收获巨大价值后与第四范式合作逐年深入。“这种独特性使第四范式拥有目前中国市场最好的行业数据使用的方法论。”曾良表示。
曾良认为,在中国做大模型研发,必须立足于To B,先B后C,间接服务C端,才有可能获得成功,过往在C端的经验与优势反而可能成为劣势。因此,谁先在B端想清楚,谁在B端具有数据积累,谁就可能最先训练出适用于B的大模型。
第二个例子是科大讯飞。科大讯飞日前对外宣布参与认知大模型讯飞星火的开发,该模型在文本生成、知识问答、数学能力三方面已经超越了ChatGPT等同类产品。
科大讯飞同时发布了多个基于讯飞星火认知大模型的产品,包括教育、办公、智能客服、汽车等多个垂直领域。这说明科大讯飞正在进行多方面布局,旨在将大模型技术应用于各行业的场景。
“科大讯飞聚焦在一个特定领域,还是可行的,数据量会比较精确、精致。但是如果想做成Open AI那种通用大模型,什么问题都能回答,什么事都能干,没有一定年头的积累,我觉得不大行。”一位熟悉人工智能的分析人士表示。
第三个例子是知乎。值得注意的是,知乎也推出知海图AI大模型,已宣布正在抓取、整理和聚合问题,知海图AI回答时达到了与GPT-4持平的效果。
“我个人判断是在某些领域一些功能还有可能实现,比如知乎在问答领域,能力可能跟GPT4功能PK,但随便画一个草图,就能够生成网站,GPT4已经实现,这一点知乎的大模型能不能实现呢?这一点我是存疑的。”上述分析人士指出。
三、谁会脱颖而出?
眼下,有两个现象引起了人们的关注。
一是中国互联网大佬们积极参与人工智能创业。据报道,王慧文创办的光年之外公司已于搜狐大厦开业。真格基金、顺为资本及王兴等知名投资方已就位,并承诺提供下一轮高达2.3亿美元的融资支持。许多大佬承诺不占有公司股份,并保留了高达75%的股份供技术人才参与。
据《量子位》报道,王小川召集了一批搜狗旧部,成立了五季智能公司。老同事茹立云占据了公司20%的股份,据说该公司的估值已经不低。除了王小川外,还有李开复、阿里VP贾扬清、亚马逊首席科学家李沐、前京东AI负责人周伯文等人也已经宣布将在人工智能领域创业。
这一波互联网圈大佬级参与创业,可谓是一个久违的景象,说明了人工智能技术已经逐渐成为新的创业热点,并且在未来的市场和发展潜力中具有非常大的吸引力和价值。这也意味着在人工智能领域未来会有更多的资本和资源的注入。
二是风险资本对生成式人工智能有着极大的热情。据Pitchbook统计的全球生成式人工智能初创企业季度融资额显示,2023年一季度宣布融资的总金额达到了100亿美元,超过前两年已完成的总融资额,近两年分别为48亿美元和45亿美元。可以看出,巨大的发展潜力吸引着大量资本和资源向人工智能商用方向倾斜。
根据CB insights的统计,约33%的生成式人工智能尚未外部股权融资,这将对全年的融资总额产生推动作用。从今年一季度数据来看,全球生成式AI企业的估值达到总计约480亿美元,相较于前两年增长了6倍,其中Jasper.ai等5家企业已成为估值超过10亿美元的“独角兽企业”,Anthropic计划在两年内筹集50亿美元,来取代OpenAI的领导地位。此外,科技和数据服务企业的创业热潮也在不断升温,彭博投资最活跃,而Salesforce旗下的风投公司在140家AI初创公司中参与了20%的投资,并于今年新设立了2.5亿美元的基金。
不过,与一般风险投资人的判断不一样,巴菲特的搭档查理·芒格则对当下的人工智能投资热潮则泼了一盆冷水。
芒格在回答股东关于人工智能未来的问题时,表达了怀疑,尽管他承认人工智能将迅速改变许多行业。芒格表示,如果你去中国比亚迪工厂,你会看到机器人到处都是。机器人使用将会在全球越来越多。不过他自己对其中的炒作,特别是涉及到人工智能的炒作感到困惑,“我觉得旧时代智能比人工智能更有效。”
对创业者与投资人来说,面临的时代背景确实已经有所不同。大模型这个风口与互联网时代创业有很大不同,新创企业成功的概率会更低。据了解,首笔投入门槛超高,对于从零开始的企业来说,需要可能上百亿人民币。
好消息是,与当年安卓开源、大量智能手机厂商崛起一样,中国公司现在都需要从头开始,各家开发自己的大模型,都有可能获得广阔的发展机会,“今年是一个真正意义上的奇点。技术积累到了一定的程度,才能突然出现爆发式进步。”曾良说。