“进退失据”的百度AI和“安于现状”的OpenAI

VRPinea 2024-05-20 15:15:19

没能抢占高地的百度AI,

以及还在大模型圈里打转的OpenAI。

文 | 青崖白鹿

(VRPinea2024年5月17日讯)上周,新华社记者出身,前华为公关部负责人,前百度公关一号位、副总裁璩(qú)静,因不当言论引发大规模舆论风波。百度在面对这一舆情时的不作为,不免让人联想到百度在AI时代下的进退失据。

本周,又正值OpenAI春季发布会举行,桌面版ChatGPT和全新旗舰AI大模型GPT-4o发布。不禁让人梦回去年,“文心一言要对标ChatGPT”、“全球大厂还没有一个做出来的,百度是第一个”。且随小P一起来看看,一年时间过去了,百度和OpenAI在AI领域都有了哪些发展吧。

(OpenAI &百度)

百度-AI

先来聊聊百度本身,百度在中国互联网行业自然是当之无愧的巨头企业,但或许,百度本可以更好。百度的发展史,从某个角度去看会发现,颇具“伤仲永”的气质。

在PC时代,百度是第一代中文互联网企业中弄潮儿般的存在;在移动互联网时代,虽然发展速度有所放缓,不及阿里和腾讯,但依旧跻身BAT三巨头的行列。(近年来也有说法,“B”已由ByteDance/字节跳动抢班夺权)

(“BAT”)

但在2022年底开始的这一轮AI大热的浪潮中,长期致力于AI研究的百度,却似乎没能把握住这股逆风翻盘的东风。在AI语言大模型领域,尽管去年3月,百度就亦步亦趋地跟随OpenAI的ChatGPT,发布了文心一言,目前也是中文互联网使用人数最多的一个大模型,但要论舆论影响力,国产AI独角兽月之暗面的Kimi,或许就要有话说了。

(月之暗面Kimi)

AI绘图领域的文心一格更是差了Midjourney不止一条街,至于文生视频,在Pika和Sora已经热度逐渐褪去的今天,百度的文生视频模型还是“查无此人”的状态。

移动互联网时代就已经露出颓势的百度,在AI的主阵地上丢掉了“护城河”,实在不该。还有一点,如果AI产业泡沫在今年随着美元降息而破裂,百度作为深度布局AI领域的企业,其未来将面临不小的挑战。

(AI的泡沫?)

就在一个月前,百度刚刚召开了“Create 2024百度AI开发者大会”,创始人、董事长兼CEO李彦宏发表了题为《人人都是开发者》的主旨演讲。李彦宏表示,“AI正在掀起一场创造力革命,未来开发应用就像拍个短视频一样简单,人人都是开发者,人人都是创造者。”

李总讲得肯定没问题,就是百度AI什么时候能够“知行合一”地跟进呢?一些专业性颇高的开发者工具就不要多提了,“一键式傻瓜操作”,才能讨得大众欢心。

(“Create 2024百度AI开发者大会”宣传图)

OpenAI

OpenAI这个名字,相信只要是对AI领域稍有关注的,都不会陌生。这个AI领域最最热门的当红炸子鸡,成立于2015年,由Sam Altman、特斯拉CEO马斯克及Peter Thiel(支付服务PayPal创始人)等六人联合创办(马斯克于2018年宣布退出)。

(OpenAI创始人Sam Altman)

2019年,OpenAI接受了微软10亿美元的投资;去年1月,微软对OpenAI进一步投资100亿美元,占股达到49%,今年2月,其最新的市场估值在800亿美元左右。

微软创始人比尔·盖茨曾在去年3月发表过一篇名为《The Age of AI has begun(人工智能时代已开启)》的博文,并在文中表示,自1980年首次看到图形用户界面GUI(包括Windows在内所有现代操作系统的先驱)以来,OpenAI的GPT模型是他见过最具革命性的技术进步。坊间传闻,微软对OpenAI的投资,就是这位传奇企业家在操盘。

(比尔·盖茨对话Sam Altman)

将视线转回当前,本周二凌晨,在OpenAI首席技术官Mira Murati主持的春季发布会上,OpenAI再次扔出了一款堪称“王炸”的大模型。可以实时对音频、视觉(图像)和文本进行多模态对话的“GPT-4o”。

GPT-4o,“o”代表“omni/全能”,GPT-4o可以实现更自然的人机交互,平均响应时间为320毫秒(0.32秒),与人类平均水平接近。OpenAI CEO Sam Altman更是直接在社交平台写下了一个意味深长的单词,“her”(《Her》,2013年上映的一部讲述人类与AI相爱的科幻爱情片)。

(Sam Altman社交平台截图与《Her》宣传图)

更重要的一点是,GPT-4o对所有用户免费开放使用。这不,AI创企Humane产品设计主管George Kedenburg前后脚的就在社交平台宣布,该公司旗下AI智能硬件Ai Pin的用户都可以体验GPT-4o。

聊完了GPT-4o的“光辉伟大”,老规矩,聊聊问题。首先,OpenAI自己也在相关公告中表示。“由于GPT-4o是我们第一个结合了所有这些模式(文字、音频、视觉等)的模型,因此我们在探索该模型的功能及其局限性方面仍处于起步阶段。”

换成大白话就是,GPT-4o注定牛逼,但现在还处在“吹牛皮”的阶段。OpenAI已经有太多处于起步阶段的东西了GPT-4、GPT-4 Turbo、Sora等,还有可自定义ChatGPT的插件GPTs(这个的口号也是,人人都是开发者)。

(OpenAI春季发布会画面)

毫无疑问,GPT-4o就像一个AI怪兽,张牙又舞爪。但是,是的,这里有一个但是,如果把GPT-4o比作这个星球上性能最强劲的赛车引擎的话,现在的问题就是,只有发动机,剩下的车架、底盘、传动、尾翼和轮胎等等,都还没有着落。

人类要想作为赛车手驰骋赛场,还需要再等等。等什么呢?百度李彦宏李总,其实去年底就说过,“在基础模型之上要有千千万万,甚至数以百万计AI原生应用,这样大模型的价值才能被体现出来。”

(“Hello GPT-4o”)

结语

用户不能感知的,不叫体验。一个大模型包含多少多少参数,对于99%的普通用户而言,都没有意义。要想获得大众市场的认可,最重要的,还是出现更多能够实际落地的应用,否则,基础模型的性能再强劲,也是白搭。

本文属VRPinea原创稿件,转载请洽:brand@vrpinea.com

1 阅读:37

VRPinea

简介:有态度、有深度、有温度的VR/AR垂直媒体