开源的未来:混乱中的探索与坚持

智能真的很好说 2025-01-04 14:20:39

  Meta及其他“开放”人工智能模型的领军者,并不愿意将“开源”一词的定义权拱手让给开源倡议(OSI)。然而,开发人员对此似乎并不太在意。

  OSI的负责人Stefano Maffulli指出,Meta正在“欺负”开源概念的行业规范。《经济学人》则以更为生动的笔触,将这场争端描绘为“无所事事的纯粹主义者……面对由身着曼基尼的马克·扎克伯格掌控的社交媒体巨头Meta”的对峙。事实证明,人工智能很难被塞进几十年前为开源软件所定义的框架中,而“开源”一词本身也已难以跟上云计算的步伐。

  Meta坚决拒绝服从OSI对开源命名权的铁腕控制,这一举动的重要性既超乎想象,又或许并不如人们所想的那般关键。

  开源的痴迷与现实

  首先,必须指出的是,开源软件既无处不在,又具有基础性。没有Linux和构建互联网的其他开源项目的庞大宝库,我们难以想象今天的科技世界会是什么样子。然而,绝大多数为使用或销售而编写的软件并非开源,这一直都是事实。

  开发人员确实关心开源,这是有充分理由的,但它并非他们最关心的问题。如Redis首席执行官Rowan Trollope在最近的一次采访中所言:“如果你是普通开发人员,你真正关心的是能力:这个[软件]是否提供了我在应用程序中需要的独特和差异化的东西。”

  不出所料,尽管Meta的限制措施并不符合OSI的开源定义,但那些坚信“开源就是OSI说它是开源”的倡导者(我历来也在这个阵营)正在对Meta所谓的开源进行质疑。然而,行业的反应却是集体耸肩,无动于衷。例如,请参见“为什么Meta LLaMA模型是开源的”这一标题,它无疑会让OSI的人感到疯狂。

  正如一位HackerNews评论员所言,这部分源于“通过Llama模型,Meta为开源大型语言模型(LLM)所做的比任何人都多。”回望过去,开源社区还可以看到Apache Cassandra、React、GraphQL、PyTorch等符合OSI开源标准的Meta项目。

  很难对一家创建了行业中一些最重要的开源项目的公司过于苛责。

  开源定义的混乱与探索

  然而,有些人对此非常不满,尽管在人工智能领域并没有(而且也不应该有)对开源的固定定义。OSI最终发布了人工智能开源的定义,即开源人工智能定义1.0,但在云计算领域,OSI正在奋力追赶,其定义并未明确训练数据也必须开放,这让一些最狂热的支持者感到失望。

  与此同时,Meta和行业其他成员不断发布新代码,并称其为开源或开放权重(Sam Johnston提供了对此的深入分析),他们并不太在意OSI或其他人的看法。Johnston可能有些夸大其词,他说:“[开放]一词在人工智能产品的品牌中出现得越多,它实际上往往不那么开放”,但很明显,“开放”一词被广泛使用,从行业领导者OpenAI开始,OpenAI在任何可识别的意义上都不开放,对任何传统定义都不太关注。

  这有什么关系吗?

  开放如其所是

  我在这个话题上一直直言不讳:开发人员想要的是易于访问且有效的软件。有时这意味着他们想要开源软件,但在云计算时代,这通常意味着他们想要一个坚实的API和免费或低成本的云服务。如我所论证的,AWS在云领域占据主导地位,并非因为其开源属性,而是因为它提供了最引人注目的云服务。只要Llama能提供生成人工智能应用程序的快速通道,无论其许可证如何,开发人员都会继续使用。

  尽管如此,Meta声称Llama是开源的,OpenAI希望在其名称中强调“开放”(尽管其软件在云服务器上运行时并不开放),这一事实表明开放性确实很重要。如果你愿意,可以称之为营销手段,但这些公司认识到,他们至少需要对开源表示尊重。

  我认为,他们对开源的不仅仅是口头上的承诺——至少Meta是这样。是的,如果你每月有超过7亿的活跃用户,他们的许可证可能会阻止你使用,但对于99.99%的Llama开发人员、企业或业余爱好者来说,这是一个毫无意义的脚注。它是开源的吗?根据OSI的定义,不是,但这就是重点:Meta不愿意在人工智能这一它擅长的领域,将开源术语的定义权让给OSI。

  开发人员似乎并不在意这一点。所以,是的,开放性很重要,但行业并不那么愿意让一个非营利组织尝试改造最初为软件打包软件设计的开源概念。OSI未能跟上云计算的步伐,这允许大型云供应商不成比例地从开源中获益,而没有给予相应的回馈。如果Meta不愿意让这种情况在人工智能领域发生,这是一个它领导的领域,那么很难责怪他们。

0 阅读:0
智能真的很好说

智能真的很好说

感谢大家的关注