免费AGI来啦:GPT-4o,你确认不是真人在扮演AI?

测试不缺高科技 2024-05-16 09:48:49

引言

OpenAI几乎每一次发布会都会给世界带来惊喜,ChatGPT是如此,GPT4.0、GPTs商店、Sora是如此,GPT-4o也不例外,再一次惊掉了很多人的下巴。

无限接近真人的GPT-4o

大家评价一个AI的智能程度如何,最直观的感受就是“多大程度地接近真人”。之前的ChatGPT、GPT-4.0已经具备一定的逼真度,尤其是在对话方面。而GPT-4o则是将这种“逼近真人”推到了极限,以至于到了以假乱真的程度。

它的逼真,不只是单纯的文字对话的逼真,而是拥有GPT-4级别的AI能力,能够基于文字、语音、视频组合输入的内容来推理,并以文字、语音、视频组合输出的真正多模态的逼真。

发布会的产品演示视频,就是最好的证明。甚至让人忍不住怀疑,这到底是AI在扮演人类,还是背后有个真人在扮演AI?

【语音对话演示】

语音对话这个并不新鲜。但通常的“语音对话”虽然看上去是基于语音的,但本质上却是“用户输入语音——语音识别成文字——文字对话——文字合成语音”的过程。

这便导致了两个直接的结果:①存在明显的延迟。②只能感知文字内容,无法感知文字以外的东西(比如:情绪)。

而GPT-4o则可以直接理解语音,因而其表现非常惊艳,它的对话几乎没有延迟,可以随时被打断,它能够感知到用户的紧张情绪,并给出放松建议。它可以用不同的声调语气讲故事和唱歌。

和GPT-4o语音对话,几乎和真人打电话没有区别,一定要说区别的话,那就是它看上去更聪明、反应更快、更有才华。

【视频对话演示】

在视频对话的演示中,GPT-4o能够根据摄像头,实时理解现实世界中用户所做的事,能够直接在线指导。这和专家私教一对一远程辅导几乎没区别,如果非要说区别,那就是,你看不到GPT-4o的容貌,但这重要吗?而且从技术上讲,基于现在的虚拟人技术,要实现也不难,只是需不需要罢了。

有了GPT-4o,再也不用担心请不起私教了。

【客户端演示】

GPT-4o同时推出了Mac版的客户端,可以快捷键唤起,可以根据屏幕内容对话反馈。基于强大的视频理解能力,GPT-4o能够识别理解的,不仅是单个截图,还包括整个屏幕的变化。

什么时候能用?如何用?价格贵吗?

了解到GPT-4o的强大,相信很多小伙伴都跃跃欲试地想使用了。如此强大的GPT-4o,会不会价格很贵用不起呢?会不会像Sora一样大部分人都用不了(空欢喜一场)呢?

这一次,OpenAI真的很良心。

OpenAI表示,GPT-4o已经开始推出,并且所有用户都可以免费使用。GPT-4o的文本和图像功能将从现在起在ChatGPT中提供,并且在未来几周内将在ChatGPT Plus中推出带有GPT-4o的Voice Mode的新版本。开发者现在也可以通过API访问GPT-4o作为文本和视觉模型,并且计划在未来几周内在API中向小部分测试者推出对GPT-4o新音频和视频功能的支持。

这意味着,只要你能够正常访问OpenAI的官网,你就可以免费用。

国内用户能用吗?

由于某些原因,一些主流的国外大模型,在国内通过官网,都是无法直接使用的,之前的ChatGPT、GPT4、Claude、Gemini Pro都是如此。因此GPT-4o同样无法直接通过官网使用。

但由于各个大模型的官方通常会提供API的渠道,使得各种第三方大模型集成商应运而生,通过他们,你可以在不使用魔法的情况下,就使用到国外的大模型。

而GPT-4o在保留GPT4级别的推理能力的同时,相比于GPT4.0 turbo在响应速度上提高一倍,接口价格却只有其一半。因此,之前提供GPT4.0服务的集成产品,大概率也会提供GPT-4o,只不过,需要多等几天罢了。

至于哪些第三方大模型集成产品可以使用,这个很容易搜到。

小编自己使用的则是ChatAI(https://ss.chatleft.com/)。尽管截至5月14日,还没有加入GPT-4o(毕竟刚发布),但根据其以往的惯例,相信用不了多久就会更新上。

国产AI产品

最后,还是希望能够支持下国产AI,比如文心一言、通义千问、Kimi等等。

对于测试领域的小伙伴们,可以了解下《》

0 阅读:0

测试不缺高科技

简介:感谢大家的关注