IT之家4月24日消息,今年3月底,OpenAI宣布计划在今年某个时候发布自GPT-2以来的首个“开源”语言模型,目前该模型的细节正逐渐浮出水面。
据TechCrunch报道,消息人士透露,OpenAI研究副总裁AidanClark正在领导这一开源模型的开发工作,该模型目前仍处于早期阶段。公司计划在今夏初发布该模型,并希望其在推理能力上超越其他同类开源推理模型。该模型将采用高度宽松的许可协议,几乎不设使用或商业化的限制。此前,像Llama和谷歌的Gemma等开源模型因限制过多而受到社区批评,OpenAI此举显然是为了避开这些争议。
近年来,OpenAI面临着来自竞争对手的巨大压力。例如,中国的DeepSeek采用开源策略推出模型,取得了显著成功。与OpenAI的策略不同,这些“开源”竞争对手将模型提供给AI社区进行实验,甚至在某些情况下允许商业化使用。这种策略已被证明极为成功,例如,Meta在其Llama系列开源AI模型上投入巨大,今年3月宣布Llama的下载量已超过10亿次。与此同时,DeepSeek也迅速积累了大量全球用户,并吸引了国内投资者的关注。
据消息人士透露,OpenAI的开源模型将采用“输入文本,输出文本”的模式,并可能允许开发者像最近由Anthropic等公司发布的推理模型一样,自由开启或关闭其“推理”功能。虽然推理功能可以提高准确性,但会增加延迟。如果此次发布反响良好,OpenAI可能会继续推出更多模型,包括更小型的模型。
IT之家注意到,此前OpenAI首席执行官SamAltman在公开场合表示,他认为OpenAI在开源技术方面“站在了历史的错误一边”。他在今年1月的Reddit问答中表示:“我个人认为我们需要制定不同的开源策略。并非OpenAI的每个人都认同这一观点,这也不是我们当前的首要任务……我们将继续推出更好的模型,但与过去相比,我们的领先优势可能会缩小。”
Altman还表示,OpenAI即将发布的开源模型将经过严格的“红队测试”和安全评估。消息人士称,公司计划为该模型发布一份模型卡,即一份详细的技术报告,展示OpenAI内部和外部的基准测试及安全测试结果。Altman在上个月的X网站帖子中表示:“在发布之前,我们将根据我们的准备框架评估这一模型,就像对待其他任何模型一样。鉴于我们知道该模型在发布后可能会被修改,我们还将进行额外的工作。”
然而,OpenAI也因匆忙对近期模型进行安全测试,且未公布其他模型的模型卡,而引发了一些AI伦理学家的批评。此外,Altman还被指控在2023年11月短暂被解职之前,误导了OpenAI高管关于模型安全审查的情况。