空降神秘大模型!力压GPT4、Claude3!数学、推理、代码能力更强

黑客运营有一套 2024-05-01 06:13:48

今天凌晨,一款名为 gpt2-chatbot 的 AI 模型突然出现在 LMsys 大模型竞技场上。

网友初步测试之后,发现效果出奇的好。

甚至,在数学、推理、代码能力上,比现在 LLM(大语言模型)头部的 GPT-4、Claude 3 Opus 还要强!

gpt2-chatbot 轻松用 ASCII 语言画出一只独角兽。

甚至,它一次就搞定了国际数学奥林匹克(IMO)问题(上图↑)。

有网友用 GPT-4 Turbo 和 gpt2-chatbot 在单个 HTML 文档中使用 JS 制作游戏。

gpt2-chatbot 表现更优异。

gpt2-chatbot 究竟是不是 OpenAI 的新模型呢?

刚刚,OpenAI CEO 山姆·奥特曼在社交媒体上表达了自己的观点:i do have a soft spot for gpt2。

有网友用 Prompt 注入攻击的方式,套取出 gpt2-chatbot 后台指令↓

它表示自己是 OpenAI 的 GPT-4 V2 版本。

不过,也有网友表示:现在很多大语言模型,都在 OpenAI 的对话中训练出来的,它们也会默认自己是 OpenAI 制作而出。

所以,在官方没有给出确认信息之前,并不能100%确定,这就是 OpenAI 的产品。

去哪里体验 gpt2-chatbot ?

第一步:打开 LMSys。

网址:https://chat.lmsys.org/

第二步:点击最上面的 Direct Chat(直接聊天)。

第三步:在选择模型(Choose any model to chat)这里,找到 gpt2-chatbot。

接下来,你就可以体验 gpt2-chatbot 了,不需要登录就可以使用。

PS:因为现在想要测试 gpt2-chatbot 的人太多,可能需要排队。

不知道是不是模型 Token 费用太高,目前 LMSys 上的 gpt2-chatbot 每个 IP 地址每天只能进行8次对话。

2 阅读:130
黑客运营有一套

黑客运营有一套

感谢大家的关注