DeepSeek立功!OpenAI披露更多o3-mini模型思考过程

Bianews 2025-02-07 08:43:08

鞭牛士报道,2月7日消息,据TC报道,为了应对包括中国人工智能公司DeepSeek在内的竞争对手的压力,OpenAI正在改变其最新人工智能模型o3-mini传达其逐步思考过程的方式。

周四,OpenAI宣布,该公司人工智能聊天机器人平台ChatGPT的免费和付费用户将看到更新的思路链,其中展示了该模型的更多推理步骤及其如何得出问题的答案。

据OpenAI称,使用o3-mini的高推理配置的高级ChatGPT计划订阅者也将看到此更新的读数。

OpenAI发言人通过电子邮件告诉TechCruch:我们为o3-mini引入了更新的思维链,旨在让人们更容易理解模型的思维方式。通过此更新,您将能够理解模型的推理,从而对其响应更加清晰和自信。

o3-mini等推理模型在给出结果之前会彻底检查自身事实,这有助于它们避免一些通常会绊倒模型的陷阱。但代价是推理模型需要更长的时间才能得出解决方案——通常要多花几秒到几分钟。

DeepSeek的R1模型是一种类似于o3-mini的“推理”模型,它揭示了其完整的思维过程,许多人工智能研究人员认为这是首选方法。除了使模型更易于研究之外,推理步骤在某些情况下还能提供更好的用户体验,帮助指示模型何时可能走在正确的轨道上,何时可能走在错误的轨道上。

OpenAI选择不展示o3-mini及其前身o1和o1-mini的完整推理步骤,部分原因是出于竞争原因。相反,用户只能看到推理步骤的摘要——有时这些摘要是错误的。

>当我们在o1-preview发布之前向人们介绍情况时,看到CoT实况通常会让他们“恍然大悟”,明白这将是一件大事。这些并不是原始的CoT,但这是向前迈出的一大步,我很高兴我们能与世界分享这种体验。

>

>—NoamBrown(@polynoamial)2025年2月6日

OpenAI仍未展示o3-mini的完整推理步骤,但该公司表示它找到了一种平衡:o3-mini可以自由思考,然后将其想法组织成更详细的摘要。

OpenAI发言人继续说道:为了提高清晰度和安全性,我们增加了一个额外的后处理步骤,让模型审查原始思路,删除任何不安全的内容,然后简化任何复杂的想法。此外,这个后处理步骤使非英语用户能够以他们的母语接收思路,从而创造更易于理解和友好的体验。

在上周的RedditAMA上,OpenAI首席产品官KevinWeil暗示这一变化即将到来。

「我们正在努力展示比今天更多的东西——[展示模型思维过程]很快就会出现。」他说。「一切都有待确定——展示所有的思维链会导致竞争性的提炼,但我们也知道人们(至少是高级用户)想要它,所以我们会找到正确的方法来平衡它。」

0 阅读:90

评论列表

邢跑跑

邢跑跑

4
2025-02-07 09:51

杭州是创业,创新的天堂。

AAAAAAn

AAAAAAn

3
2025-02-07 10:04

现在来看马斯克是一个有预见性的人,当时OpenAI要闭源挣大钱,马斯克坚绝反对要开源,他说开源是AI的未来,这帮货不听让马斯克滚出了股东大会。马斯克要谢谢中国的Deepseek帮他打了这帮所谓世界领先的美国AI专家的嘴巴!

shark 回复 02-07 22:54
这也能舔啊!

静候佳音

静候佳音

3
2025-02-07 08:54

deepseek成本这么低,阁下怎么应对[捂脸哭]

好物分享

好物分享

3
2025-02-07 09:58

接连的发声,真的有点慌了,我们作为追赶者完全不着急

忘川流光

忘川流光

2
2025-02-07 09:28

什么时候发明一种可以追踪蒸馏,模仿等抄袭行为的技术,让投入资金和付出努力的组织别白白给别人做嫁衣,不劳而获!

爱国者3

爱国者3

1
2025-02-07 11:49

国内禁止使用openAI