消息称OpenAI计划今夏初发布开源语言模型，力争推理能力超越同类

IT之家4月24日消息，今年3月底，OpenAI宣布计划在今年某个时候发布自GPT-2以来的首个“开源”语言模型，目前该模型的细节正逐渐浮出水面。

据TechCrunch报道，消息人士透露，OpenAI研究副总裁AidanClark正在领导这一开源模型的开发工作，该模型目前仍处于早期阶段。公司计划在今夏初发布该模型，并希望其在推理能力上超越其他同类开源推理模型。该模型将采用高度宽松的许可协议，几乎不设使用或商业化的限制。此前，像Llama和谷歌的Gemma等开源模型因限制过多而受到社区批评，OpenAI此举显然是为了避开这些争议。

近年来，OpenAI面临着来自竞争对手的巨大压力。例如，中国的DeepSeek采用开源策略推出模型，取得了显著成功。与OpenAI的策略不同，这些“开源”竞争对手将模型提供给AI社区进行实验，甚至在某些情况下允许商业化使用。这种策略已被证明极为成功，例如，Meta在其Llama系列开源AI模型上投入巨大，今年3月宣布Llama的下载量已超过10亿次。与此同时，DeepSeek也迅速积累了大量全球用户，并吸引了国内投资者的关注。

据消息人士透露，OpenAI的开源模型将采用“输入文本，输出文本”的模式，并可能允许开发者像最近由Anthropic等公司发布的推理模型一样，自由开启或关闭其“推理”功能。虽然推理功能可以提高准确性，但会增加延迟。如果此次发布反响良好，OpenAI可能会继续推出更多模型，包括更小型的模型。

IT之家注意到，此前OpenAI首席执行官SamAltman在公开场合表示，他认为OpenAI在开源技术方面“站在了历史的错误一边”。他在今年1月的Reddit问答中表示：“我个人认为我们需要制定不同的开源策略。并非OpenAI的每个人都认同这一观点，这也不是我们当前的首要任务……我们将继续推出更好的模型，但与过去相比，我们的领先优势可能会缩小。”

Altman还表示，OpenAI即将发布的开源模型将经过严格的“红队测试”和安全评估。消息人士称，公司计划为该模型发布一份模型卡，即一份详细的技术报告，展示OpenAI内部和外部的基准测试及安全测试结果。Altman在上个月的X网站帖子中表示：“在发布之前，我们将根据我们的准备框架评估这一模型，就像对待其他任何模型一样。鉴于我们知道该模型在发布后可能会被修改，我们还将进行额外的工作。”

然而，OpenAI也因匆忙对近期模型进行安全测试，且未公布其他模型的模型卡，而引发了一些AI伦理学家的批评。此外，Altman还被指控在2023年11月短暂被解职之前，误导了OpenAI高管关于模型安全审查的情况。

世良情感网

消息称OpenAI计划今夏初发布开源语言模型，力争推理能力超越同类

热门分类