OpenAI终止服务,套壳大模型遇阻,阿里通义要平替ChatGPT?

科技铭程 2024-06-29 18:27:32

6月25日,OpenAI发布通告:从7月9日开始,停止来自不在OpenAI支持的国家、地区名单上的API使用,要继续使用OpenAl的服务,需要在受支持的地区访问该服务。

API就是应用程序编程接口,通过这个接口,可以让原本两个独立的系统进行通信和数据交互。

最简单的就是我们把手机和电脑通过数据线连接在一起,在电脑上我们可以对手机进行操作,当然如果协议允许,我们也可以对电脑进行操作,而这根数据线就相当于API。

根据OpenAl官网的公告,当前OpenAI的API已向近190个国家和地区开放,但中国大陆和中国香港不在支持区域。

这么一来的话,那些依靠调用OpenAI数据的“套壳”大模型将面临毁灭性打击,“套壳”大模型普遍没有自己的核心技术,就是依靠调用OpenAI的相关数据,然后进行简单的包装,提供给使用者。

真应了那句广告台词:我们不生产水,我们只是大自然的搬运工。

那么国内套壳大模型有哪些呢?

据报道,李开复创立的“零一万物”发布了两款大模型,Yi-34B和Yi-6B,就被指出与海外的大模型架构相似,仅是做了部分修改。

而在ChatGPT、Meta和Llama开源后,国内市场突然出现了多款AI大模型,更为奇妙的是很多大模型居然称自己遥遥领先。

就连网友都忍不住说:不开源就说卡脖子,一开源套个壳就是遥遥领先。

有好事的网友对国内的一些大模型做了一个试验,发现很多大模型在不同程度上调用了ChatGPT的相关数据。

当提问草莓(strawberry)这个单词有几个r时,它们的回答令人震惊。

“智谱清言”、昆仑万维的“天工”大模型、百度的“文心一言”,科大讯飞的“讯飞星火”,无一例外回答有字母“r”出现过两次。

而这个错误回答正是因为ChatGPT回答:字母“r”有2个。

也就是说,这些国内大模型的正牌军也不同程度的调用了ChatGPT的数据,甚至是“套壳”。

而那些影响力较小的大模型,或许我们并不熟悉,但是从投资规模上可以肯定是“套壳”,

你知道开发ChatGPT到底有多烧钱吗?

ChatGPT不仅仅是吞金巨兽,而且还要吞电、吞水。

OpenAI早期开发ChatGPT就花费了8亿美金,随着不断的升级迭代,这需要更高的算力,8亿美金显得杯水车薪。

训练GPT-4,需要3万多片英伟达A100来维持算力需求,一片A100价格为1万美元,光芯片就需要花费21亿人民币。

训练GPT-5,需要英伟达H100,数量高达5万片,每片H100价格高达4万美元,芯片花费20亿美元,约合140亿人民币。

而国内美团联合创始人王慧文高调宣称计划出资5000万美元,打造中国版的ChatGPT,这不是扯淡吗?

5000万美金根本就买不起计算芯片,即便能租用算力,那你知道GPT训练一次需要多少钱吗?500万美元。

5000万美元也就能训练10次。

此外,ChatGPT日常使用耗电量十分惊人,单日用电量高达50万度电,相当于1.7万个家庭日耗电量(美国家庭日耗电29度),一年电费就高达2亿。

研究表明,ChatGPT每与用户交流25-50个问题,就需要“喝”下500毫升的水。GPT-3的训练就消耗了近70万升的水,而升级后的GPT5.0消耗的水资源会更多。

这些水主要用于冷却降温,都是纯净的淡水。

这样的一个吞金、吞电、吞水的巨兽,是普通公司能养的起的吗?所以,当一家公司计划拿出几个亿搞大模型时,我们就当笑话看看就行了。

OpenAI花费巨资打造了ChatGPT和Sora大模型,一个文字,一个文生视频,公司身价也水涨船高,目前估值已经达到了1000美元,当初微软花费130亿美元进行收购,是血赚啊!

当然这些钱也不是白花的,资本一定要几倍的赚回来,所以ChatGPT向全世界190多个国家授权使用。

用户注册OpenAI账号后,付费后即可拿到API密钥,可调用人工智能大模型,当前GPT-4的API定价为每1K个Prompt token0.03美元,每1K个Completion token0.06美元。

尽管国内因为种种限制无法使用ChatGPT,但是还是很多企业和个人绕开限制,链接到了ChatGPT,通过API调用相关资源。

但是好景不长,OpenAI在2023年底禁用了字节跳动的接口,原因是涉及个人数据滥用问题。

意大利直接宣布对OpenAI调查,因为在对话中ChatGPT收取了大量的用户信息,涉及数据安全和隐私。

马斯克也表示,如果苹果在设备中整合了OpenAI,那么苹果产品将禁止出现在马斯克公司内,因为这会带来安全问题。

在受到地缘政治、数据安全、隐私等多方面的压力后,OpenAI计划2024年7月9日起,阻止来自非支持国家和地区的API调用,其中包括中国内地和香港。

尽管对一些套壳或者依赖OpenAI数据生存的大模型来说,遇到了困难,但是对真正自主研发AI大模型的企业来说,是千载难逢的机会。

就在OpenAI宣布终止对中国提供API服务后,阿里云百炼第一时间宣布,将为OpenAI API用户提供具有性价比的中国大模型替代方案,并为中国开发者提供2200万免费tokens和专属迁移服务。

阿里的通义千问大模型相当于GPT-4版,并列全球第四,文字处理能力非常强大,但数据调用价格仅为GPT-4的50分之一。

没有了OpenAI,立即出现了平替的通义千问,这个无缝衔接,估计把对手气坏了吧!看来国内还是有真心研究AI大模型的企业的。

其实研发大模型不仅仅需要砸钱,还需要发展一系列的配套设施以及人才储备。

配套设施方面主要是算力中心的建设,而算力中心的核心就是算力芯片,如何打造国产算力芯片,取代英伟达H100,会是接下来的一场硬仗。

人才建设方面,其实国内不缺人才,每年1000多万毕业生,找不出做AI大模型呢?恐怕没人相信。

如何让人才不被埋没,他们施展空间,让他们在研发方面拥有更多的主动权和灵活性,才是政府和企业最该考虑的问题。

AI竞争,需要我们提高站位,不要因为“小年轻”抢了自己的风头,没有给自己面子,就拼命打压限制,AI是长跑,也是人才的接力赛,我们不能错过任何一点点机会,珍惜自己的长处。

我是科技铭程,欢迎共同讨论!

2 阅读:142
评论列表

科技铭程

简介:喜欢科技,喜欢聊科技,更喜欢分享科技。