AI时代的中国困境:ChatGPT为什么难以复制

博文视点说科技 2024-03-09 00:22:15

如今,几乎所有中国互联网大厂都公布了自己的“类ChatGPT”解决方案,有些还公布了背后的关于AI技术模型的详情。

其中最高调的是百度,其“文心一言”解决方案号称即将接入数十家内容平台和数以百计的媒体、自媒体。腾讯公布的微信 AI 模型“WeLM” (WeChat Language Model)亦受到了资本圈的广泛关注,其应用重点指向文本生成和翻译。美团联合创始人、被尊称为“老王”的王慧文,此前一直在寻找Web 3.0赛道的创业机会,在ChatGPT火起来之后,他迫不及待地宣布愿意立即带5000万美元加入AI创业,由此还引发了一些人的嘲讽——5000万美元对于AI研发而言,实在是太少了。

无论如何,任何中国互联网公司(不管是大厂、小厂还是创业公司),要想在短期内缩短与ChatGPT的差距,可能性几乎无限趋近于零。因为竞争对手实在太强,产品进化太快了!

2023年3月2日,百度的文心一言和腾讯的WeLM尚未上线,OpenAI实验室就正式开放了ChatGPT API(应用程序编程接口),每输出100万个单词的价格仅为2.7美元。

这意味着从2022年11月底ChatGPT发布开始,短短三个月之内,OpenAI已经将其应用成本砍掉了90%!难以想象,今后基于AI的应用开发会便宜到什么地步;更难以想象的是,中国厂商要如何缩短如此巨大的差距!

中国在AI技术研发方面当然存在许多劣势:中国的基础研究整体水平与美国还有很大差距;高等院校、科研院所对美国顶尖研究机构的追赶才刚刚开始;国内企业普遍比较年轻,不像欧美大型企业那样拥有长达数十年的研发积累。

举一个最简单的例子:在机器学习训练领域,对GPU(图形处理单元)芯片的需求是非常巨大的。

据美国咨询公司TrendForce的估计,要维持GPT-3.5大模型的运作,至少需要2万颗GPU,其中不乏英伟达出品的A100/H100高端GPU。自从ChatGPT发布以来,英伟达的股价经历了几轮飙升,就是因为市场意识到了机器学习是一场基于GPU供给的烧钱竞赛,烧得多不一定能赢,烧得少一定赢不了。

若不是部署了数以万计的A100 GPU,微软Azure云拿什么去训练ChatGPT?

目前在国内,大部分云计算服务商,无论是互联网系还是非互联网系,主要使用的还是中低端GPU。

自从2022年美国颁布《2022年芯片与科学法案》(就是人们常说的《芯片法案》)以来,国内企业进口英伟达高端GPU的难度大幅提升了。

其实,就算进口高端GPU没有阻碍,上万颗A100/H100级别的GPU的采购成本也是天文数字,目前在国内,恐怕仅有腾讯、阿里、华为、字节跳动等寥寥数家有能力承担。

何况,采购不是结束而是开始,由上万颗GPU组成的AI算力集群的运营成本亦是无底洞。在ChatGPT火遍全球之后,微软立即向OpenAI再次注资100亿美元,用于后续研发和应用——哪怕以互联网巨头的标准看,100亿美元也不是一个小数目!

乐观的人认为,上述劣势是中国经济发展中出现的结构性问题,归根结底是钱的问题。只要经济继续发展下去,钱总是越来越多的。至于芯片等高端技术装备的禁运问题,对于中国而言也不是什么新鲜事了;在全球化的大背景下,任何国家与其他国家之间都不可能做到真正的脱钩。总而言之,问题是可以通过时间自然而然解决的。

然而,即便我们赞成上述乐观观点,总归还有一些劣势是短期内无法解决的。它们需要我们运用智慧,在较长时间里慢慢解决。

过去多年,英语一直是全球互联网的第一语言,而中文信息的丰富程度要落后不少,这就意味着用中文语料库对AI进行训练的难度要更大一些。目前国内受过高等教育的劳动力还处于增长阶段,劳动力成本可控,企业对于“AI替代人工”的内生需求尚不十分强烈。弥漫于国内科技行业(包括但不限于互联网行业)的急功近利的“内卷”文化,限制了基础研发的空间。对于国内互联网行业,在过去十几年,不少公司习惯投资立竿见影的技术和应用,两三年就要看到效果,而要做好基础研发,就必须克服这种急功近利的文化。

先说第一个问题。

虽然汉语是全世界母语人数最多的语言,但是英语仍然是全世界使用面最广的语言,在互联网上尤其如此。

据咨询公司W3Techs的统计显示,截至2023年3月初,在全球互联网的所有网站当中,英文网站占比为56.6%,而中文网站占比仅为1.5%。

全球互联网各语言网站占比(截至2023年3月初)

(数据来源:W3Techs)

占比这么低的中文信息,还被各大互联网平台“生态系统”割裂成无数碎片。

百度搜索引擎既无法覆盖淘宝商品信息,也无法覆盖微信公众号;微信、抖音、快手等头部App的内容,基本上只能被它们内部的搜索功能触及。

中国互联网巨头若想训练自己的ChatGPT,只能基于自身生态系统的数据;至于那些中小型公司,除非傍上巨头的大腿,否则连基本的数据供给也难以保证。

当然,中国厂商也可以主要使用英文信息训练自己的AI模型,但这无疑将降低其在国内市场的应用潜力。

在内容质量上,中文信息更难以与英文相提并论。全球顶尖的学术期刊、学术会议一般均使用英文,非母语学者一般同时采用母语和英语两种工作语言,这一局面在短期内不会改变。顶尖金融机构、咨询公司和智库的大部分研究报告也首发英文版本,仅有少数有中文版本。

只有在研究中国特有的问题时,中文资料的作用可能更大;在研究其他问题时,中文资料的意义就远不及英文了。

而在与艺术相关的专业领域,例如美术、影视、设计、艺术史等方面,法文资料的重要性超过了英文,参加过国际电影节的专业人士都知道制作法文字幕和法文小册子的重要性。

无论如何,中文在国际上能唱主角的领域还不多。

同时必须承认,信息流媒体的算法推荐机制也拉低了中文信息的水平——大批自媒体致力于追逐短期热点,通过算法获得更多流量,从而加剧了信息的同质化、降低了有用信息密度。

在对AI进行训练时,高度同质化的语料库效果,显然比不上富有多样性和原创性的语料库效果。

从这个意义上讲,中文互联网上的“震惊体”“废话体”内容比例越少,对AI模型的训练就可能越有效。

有人会说:“语言问题也可以随着时间得到解决。当中国足够强大之时,中文信息在数量上和质量上都将获得优势,没有必要杞人忧天!”

这种观点与姜文在出演《星球大战外传:侠盗一号》电影之后发表的论断有异曲同工之妙:美国电影能够流行全球是因为美国有十多个“航空母舰战斗群”,当中国也拥有这么多“航空母舰战斗群”之后,中国电影就可以流行全球。

不过,这个过程不是几年、十几年内能够完成的——中国厂商总不能等待中国有了十几个“航空母舰战斗群”之后,再去做自己的ChatGPT吧?

再说第二个问题。

技术研发归根结底是由应用需求推动的,例如机器学习在互联网广告推送上的巨大作用,就刺激了包括谷歌、亚马逊、字节跳动在内的一批互联网大厂研究机器学习。

以ChatGPT为代表的自然语义聊天机器人,其首要应用场景还是运营和客服,其次是对内容开发乃至程序开发的辅助。

在OpenAI公开ChatGPT API之后,首批接入的SnapChat、Instacart、Shopify等美国互联网公司均有巨大的客服替代需求。

对于劳动力成本高的美国和欧洲企业客户而言,ChatGPT可谓雪中送炭。

别误会,近年来中国的劳动力成本亦呈现不断上升的趋势,在局部还出现了劳动力短缺的情况。可是相对于发达国家,中国的劳动力,尤其是受过教育的劳动力,薪酬水平还是相对较低的。对于大部分企业而言,月薪几千元的电商客服、上万元的内容运营人员、一两万元的入门级码农,虽然越来越难招了,但总归还是能招到的。

问题来了:一边是远低于欧美的用工成本,一边是可能高于ChatGPT的国产AI解决方案成本,企业主会如何抉择?

就拿前文讨论过很多的AIGC来说:假如一张二次元游戏立绘(角色全身站立图)的人工成本是2万元,游戏公司大概很有动力用AI取代一部分画师,财力比较薄弱的中小型游戏公司会更积极。

但是,假如一张游戏立绘只花费 2000 元乃至1000元呢?假如画师本人不是全职员工,只是随时签约的外包人员,不用占用游戏公司的社保成本和办公场地呢?与其冒着不确定的风险去尝试AIGC,大部分游戏公司还是乐意继续使用人力吧?至于文字创作,成本就更低了——很多几十万粉丝的自媒体大号对外征稿的报价也才一篇几百元,而且可以让对方反复修改,耗费的精力比调教AI还低。

附带说一句,中国现阶段的“用工荒”,其实主要体现为蓝领用工荒——技术工人难找,训练有素的服务人员难找,受过高等教育的白领却不太难找。

AI应用在早期取代的主要是中低端白领,这恰好是中国劳动力过剩最明显、最不需要AI替代的领域。2022届全国大学毕业生规模达到1076万人,再创历史新高;加上约130万硕士、博士毕业生,全国在一年之内新增的白领人才后备军高达1200万人之巨。总而言之,中国的“智力资本”还处于高速扩张的状态之中,这在宏观上当然是中国经济的一项重要优势,但是也不可避免地压低了企业用AI替代人力的需求。

由此导致了一个“先有鸡还是先有蛋”的瓶颈:因为AI解决方案相对于劳动力的成本优势不明显,企业客户缺乏充分动力使用AI应用,这种需求不足又会抑制AI厂商进行技术研发的积极性,导致国产AI解决方案更不具备价格优势。

除非劳动力成本突然大幅上升,或者有大厂愿意不计回报地砸钱,否则这个恶性循环很难被打破。当然,考虑到目前中国厂商对生成式AI的研发尚处于初级阶段,离广泛应用还比较遥远,它们现阶段或许不用太担心这个问题,不过它们总有一天还是需要直面这个问题的。

接着说第三个问题。

在2021年的谷歌年报中,管理层写道:

“在历史上,不走寻常路的精神一直驱动着我们,鼓舞我们去解决重大问题,投资人工智能和量子计算研究等疯狂的想法。”

乍听起来,“不走寻常路”是一种很酷、很特别的精神,“疯狂的想法”则是伟大公司基业长青的关键。

在于,这可能意味着短期内远离主流、蒙受损失、受到外界的冷嘲热讽。一家公司若要把“不走寻常路”的精神贯彻下去,至少要具备两个条件:一个足够赚钱的主营业务(俗称“现金牛”),以及鼓励长期主义的组织文化。如果有可能,还应加上第三个条件:负责“疯狂的想法”的部门(往往是基础研发或创新业务部门)与负责赚钱的部门分开管理,遵从不同的KPI,并且受到同等的重视。

微软及其参与孵化的OpenAI,恰恰同时符合上述三个条件:第一,微软的主营业务非常赚钱,具备“不走寻常路”的足够本钱;第二,在战略性的新方向上,微软一贯不吝于持续多年投入,游戏及云计算业务就是典型;第三,OpenAI并非微软旗下的部门,而是一个独立运作的公司(以前曾是非营利组织),所以既能享受微软的扶持又能保持创业公司的锐气。

在ChatGPT诞生之前,马斯克等早期投资者也曾一度丧失信心、打退堂鼓,不过OpenAI还是坚持了下来。这才是“不走寻常路”的真实含义——努力尝试不一定能成功,可是只要还在尝试,就有希望。

从这个角度看,虽然谷歌推出的Bard AI聊天机器人早期反响不佳,但谷歌确实是仅次于OpenAI的成功候选人之一。

谷歌的创始团队和现任管理层一直在用互联网广告业务的利润支持自动驾驶、医疗等新兴业务,以及各个方面、各个阶段的前瞻性研究。作为由专业科研人员创立的公司,谷歌一直非常重视研发部门,优秀的基础研发人员受到的重视程度丝毫不亚于一线业务人员。不过,在现实应用层面,谷歌倒是一贯以缺乏耐心著称,因为缺乏成效而迅速被它放弃或边缘化的消费级业务不在少数,最近一个案例就是一度被寄予厚望的Stadia云游戏平台。

各种迹象显示,谷歌做出自己的“ChatGPT”只是时间问题,如果连它都做不出来,那简直无法想象还有谁能做出来。

那么,中国互联网公司又如何呢?它们并不缺乏赚钱的主营业务,但是它们所处的环境变化太快,太需要“居安思危”的精神。领先者稍微停下思考一下,追赶者可能就逼近到眼前了。结果就是,大家都强调以快取胜,先动手做起来,在实践过程中慢慢形成理论。

这种高度务实的文化,培养出了高度务实的管理层和业务中坚层。公允地说,这是中国互联网行业的一个特点,而不是缺点;这在有些时候是互联网公司的加分项,有些时候却是减分项。

中国互联网公司在进军海外市场,尤其是发达国家市场时,经常会惊叹于对方企业的效率之低下:在对方还在按照流程慢悠悠地讨论问题时,我们的企业可能已经把事情做完了;抱着这种心态做一线业务,其实是不错的;可是在这种心态下培养起来的企业文化、成长起来的管理层,对于负责基础研发项目恐怕就不太擅长了。超过三年以上才能看到成效的研发方向,以及不知道具体怎么应用的基础技术——就算这样的项目能够被允许存在,其在公司内部的优先级也不会太高。

从纸面上看,国内互联网大厂都建立了独立的基础研发部门,聘请知名专家乃至院士指导重要工作。在现实中,此类基础研发团队由于与一线业务相隔较远,其战略意义往往没有得到足够重视,从企业高层获得的资源也不太稳定。

阿里于 2017 年成立的达摩院已经是其中命运较好的一个了,获得了巨额预算和高度独立的组织地位,在芯片、人工智能等领域也拿出过一些实用化的研究成果。然而,从 2022 年开始,达摩院还是被要求自负盈亏,背上了短期考核压力。达摩院尚且如此,其他互联网大厂的基础研发部门的处境显然不可能更好。

阿里旗下的达摩院可能是国内互联网行业内规模最大、投入最多的基础研发机构

其实,如果还要继续找理由,还能找出很多,但是万变不离其宗:在上一个时代引向成功的决定性因素,在下一个时代经常会沦为拖后腿的因素。

当运动员为了新赛季努力锻炼的时候,若不知道新赛季的比赛规则发生了什么根本性变化,锻炼准备就有可能事倍功半。

如果没有庞大的受过高等教育的白领劳动力,中国的互联网行业乃至整个科技行业不会发展得那么好;如果没有以快取胜、高度务实的企业文化,中国互联网大厂的成长速度不会那么快。

过去二十年,互联网从业者习惯了以“高举高打”的战术去打一系列的闪电战,并取得了辉煌的战果。现在,要转向比拼基础研发的消耗战,在转型过程中出现不适应是正常的,这就是转型所必须付出的代价。

从ChatGPT诞生至今,国内互联网从业者及投资人的反应看,大部分人还是希望用“高举高打”的战术去解决AI研发问题的。美团联合创始人王慧文的那条朋友圈,算是这种心态的一个集中体现:

“组队拥抱新时代,打造中国OpenAI,设立北京光年之外科技有限公司,我出资5000万美元,估值2亿美元。我当前不懂AI技术,正在努力学习,所以个人肉身不占股份,资金占股25%。75%的股份用于邀请顶级研发人才,下轮融资已有顶级VC认购2.3亿美元,各位大牛不必为资金忧心,放心施展你的才华,杂事交给我来打理。”

王慧文是一位非常成功的互联网企业家,是美团在执行层面击败竞争对手的最大功臣之一。

在淡出美团日常管理之后,他在清华大学开设的“互联网产品课”亦获得了大批专业人士的点赞。他能否在AI赛道实现二次创业成功?

我不知道,但有一点可以肯定:“打造中国OpenAI”所需要的战略战术与打造消费互联网公司完全不同。5000万美元的启动资金、2.3亿美元的下轮融资、成功互联网企业家的加入、改变世界的豪迈气概……这些并非是在AI基础研发赛道上取得成功的充分条件,甚至不一定是必要条件。

只问一个问题:假如“北京光年之外科技有限公司”像OpenAI一样,在成立后整整七年才拿出震惊世界的应用产品,有多少人能熬过这短暂而又漫长的七年?

把目光放远一些,其他新兴赛道何尝没有类似的情况?扎克伯格领导下的Meta因为在VR/AR技术上投入过多,引发了华尔街机构的强烈不满,认为Meta被华而不实的“元宇宙愿景”绑架了。

赞赏扎克伯格的元宇宙愿景,认为他对VR/AR技术的应用方向有战略性误判。但是我欣赏这种乐意在一个未经验证的新兴方向上投入重兵,坚信时间站在自己一边的精神。

在Meta的影响之下,字节跳动于2021年收购了VR设备厂商PICO,全面加入元宇宙战局。可是仅仅一年多之后,PICO就开始裁员,字节跳动的元宇宙野心也已意兴阑珊。与美国同行相比,中国互联网公司不论在投入一项业务还是在关闭一项业务上,都是效率更高的“快公司”!

或许有人会说:中国互联网巨头比美国同行聪明,不会在一条错误的道路上走太久——问题在于,谁能在半路就判断一条道路是正确还是错误的呢?人类历史迄今最大的国家级研发项目是第二次世界大战期间由美国政府主导的“曼哈顿工程”。今天的人都知道,这个项目成功了,开启了核武器时代,让美国以较小的损失赢得了对日战争。可是直到第一颗原子弹“瘦子”挂在铁塔上等待引爆时,洛斯阿拉莫斯国家实验室的科学家仍然在打赌:这玩意儿到底能不能爆炸?要知道,曼哈顿工程只持续了四年,AI技术的任何一个应用方向的研发可能都要耗费更长的时间。

有人又会问:既然国内互联网公司在AI赛道上存在天然劣势,那么可不可以依靠中小型专精特新公司乃至创业公司去主打这条赛道呢?从事实看,不是已经有一批互联网大佬、互联网投资人把AI视为新的热门创业赛道了吗?对于这一点,我的看法相对保守,原因有二。

(1)受到经济发展阶段和用户习惯的限制,在中国做企业级(To B)解决方案很难赚到大钱,很难称得上是一门好生意。从中国企业软件行业过去多年的成长历程就可以看出,在中国,只做技术解决方案、不服务消费级客户,这条道路何其艰难!消费互联网巨头向企业级市场扩张相对容易,反过来却是难上加难。(2)如果要AI公司自己去做消费级业务,难度更是呈几何级数增加。中国的消费互联网市场的马太效应早已登峰造极,中小平台、垂类平台的生存空间比欧美还要小。除非Web 3.0打破互联网平台的头部垄断格局,否则在Web 2.0的既有格局下,AI独角兽们想做大自己的消费级业务,可能性几乎为零。

因此,我认为即便有一天中国能产生自己的“OpenAI”,它也不可能是独立产生、独立成长的;甚至不太可能像美国的OpenAI那样,在巨头的羽翼之下相对独立运营。

它要么直接产生于互联网巨头内部,要么在做出一些成就之后被互联网巨头并入麾下。换句话说,中国最前沿的AI技术研发将始终是互联网行业的一部分,在互联网巨头的生态系统之内运行。下面的章节将详细解释上述判断。

跟着《大势:站在十字路口的互联网行业 》一起畅想互联网乃至整个科技行业的下个时代。

0 阅读:0

博文视点说科技

简介:感谢大家的关注