日前,开放源代码促进会(Open Source Initiative,OSI)在2024 ALL THINGS OPEN上正式发布了《开源人工智能定义》1.0版本(以下简称为《定义》)。据悉,《定义》是由超过25个企业或组织共同设计,其中包括微软、谷歌、亚马逊、Meta、英特尔、三星、Mozilla基金会、Linux基金会、Apache软件基金会。
据OSI方面介绍,《定义》将作为衡量AI系统是否符合开源AI标准的依据,为社区主导的公开评估提供统一指导。同时该标准旨在提供一个帮助AI开发者和用户确定AI系统是否开源的框架,并将涵盖开源AI的代码、模型和数据信息。
具体而言,《定义》要求开源AI应当允许开发者或用户在将其用于任何目的时,无需请求许可;同时开源AI还应支持开发者研究其工作原理、组织架构,以及不论出于任何目的地修改模型;此外,无论开源AI是否经过修改,也应共享其模型供他人使用。而在机器学习方面,《定义》要求开源AI在修改其机器学习系统后,应提供相关训练数据的详细信息、完整源代码,以及模型参数,以便其他开发者可构建基本等效的系统。
对此Mozilla AI战略负责人Ayah Bdeir指出,《定义》的要求远高于当前市场上许多所谓开源AI的实际水平,“这标志着我们开始认真审视AI训练数据的复杂性,既承认共享完整数据集的难度,又致力于推动开放数据集在AI系统中的普及。尽管这种对数据的开放方式或许并不完美,但如果追求一个任何模型开发者都难以企及的完美标准,反而可能适得其反”。
OSI董事会主席Carlo Piana则表示,“《定义》的整个指定过程都遵循董事会的原则,管理团队和全体员工也忠实执行了相关指导方针。董事会深信,这一标准符合开源理念和四项基本自由。更令人振奋的是,该标准还将帮助OSI为整个行业提供切实可行的开源指引”。
此外OSI执行主任Stefano Maffulli还补充到,“制定《定义》1.0版本的过程充满挑战,也带来了诸多新的难题。虽然这一过程涉及不同观点、未知技术的探索,偶尔还会引发激烈的争论,但最终的成果与最初设定的目标高度契合。这仅仅只是一个起点,随着我们与广大开源社区逐步加深对《定义》1.0版本的理解和应用经验,我们将携手完善这一标准”。