OpenAI目前正致力于发布尽可能多的新闻。在公布了新的图像模型、大规模规则变更以及为免费用户提供的新功能之后,这家AI巨头还透露了计划推出一款全新的模型。

尽管细节仍然笼罩在神秘之中,但Sam Altman通过X宣布,这将是一款开放权重的语言模型——这是自2019年GPT-2发布以来的首款此类模型。
在他的公告帖子中,Altman表示:“在发布之前,我们将根据我们的准备框架评估该模型,就像我们对其他模型所做的那样。鉴于我们知道该模型在发布后会被修改,我们将进行额外的工作。”
简而言之:我们很高兴在未来几个月内发布一款强大的新型开放权重语言模型,并希望与开发者讨论如何使其发挥最大效用:https://t.co/XKB4XxjREV我们非常期待将其打造成一款非常、非常优秀的模型!我们计划在2025年3月31日之前完成。
那么,什么是开放权重模型?为什么在发布之前需要比平常投入更多的工作?
什么是开放权重模型?当我们谈论AI模型时,主要有三种类型:封闭式、开源式和开放权重式。
封闭式模型是我们最常见的类型。这些包括像ChatGPT和Google Gemini这样的大名鼎鼎的模型。它们可以通过公司提供的应用程序和网站使用,但除此之外没有其他交互。
开源式模型是公司公开用于创建、训练和运行AI模型的所有代码。这使得公众可以了解模型的构建和训练方式,并使用这些代码来训练自己的模型。
开放权重模型则是可以免费下载和修改的模型。模型的“权重”是模型在训练过程中学习到的数值参数。
将权重视为模型所拥有的所有知识。想象一下,AI模型就像大脑,权重就是将所有神经元连接在一起的路径,包括它所知道的一切、思想与想法之间的联系,以及它的创造性思维和推理能力。
通过访问开放权重模型,可以对其进行编辑以执行新的或更具体的任务,甚至可以简单地分析用于训练这些模型的数据。
这一切意味着什么?对于普通人来说,OpenAI的开放权重模型可能并不那么令人兴奋。它需要对AI模型及其编码有详细的了解,以及大量的计算能力。
这并不是说它不会产生深远的影响。当大公司发布更向公众开放的模型时,它允许小公司推进自己的项目,将一个几乎完成的模型调整成完全不同的东西。
虽然这些模型可以带来创新的机会,但它们也带来了风险。
开放权重模型使用成本更低,可以针对更敏感的使用场景进行定制,处理高度机密的信息,并将模型的所有信息保存在一台隔离的机器或服务器上。
虽然这些模型可以带来创新的机会,但它们也带来了风险。AI可能并且已经被滥用。开放模型增加了更广泛人群的访问,这些人可能会制造危险的AI模型。
“安全是我们开放权重模型开发的核心重点,从预训练到发布。虽然开放模型带来了独特的挑战,但我们以我们的准备框架为指导,不会发布我们认为会带来灾难性风险的模型,”OpenAI团队成员Johannes Heidecke在X上的一篇帖子中表示。
“我们特别关注研究对抗性微调和其他开放模型特有的风险。与所有模型发布一样,我们正在进行广泛的安全测试,包括内部测试和与可信第三方专家的测试,然后再向公众发布。”
OpenAI的这一决定紧随其他大型AI模型的脚步。Deepseek、Meta和Google都已经发布了开放权重模型,并且似乎致力于在未来继续推进这一方向。
