去年,人工智能初创公司OpenAI在旧金山举办了首次开发者大会,声势浩大,并推出了包括最终未能成功的GPTStore(类似苹果应用商店)在内的多款新产品和工具。
然而,今年的活动将相对低调。本周一,OpenAI宣布,将其DevDay开发者大会转型为一系列聚焦开发者的参与式会议。公司还确认,在DevDay期间不会发布下一代主旗舰模型,而是将重点放在其API和开发者服务的更新上。
OpenAI发言人透露:“我们不打算在开发者大会上宣布我们的下一个模型。我们将更多地专注于向开发者介绍现有资源,并展示开发社区的故事。”
今年的OpenAIDevDay活动将于10月1日在旧金山、10月30日在伦敦和11月1日在新加坡举行。所有活动都将以研讨会、分组讨论、OpenAI产品与工程团队的现场演示,以及开发者会议的形式举行。注册费用为450美元,报名截止日期为8月15日。
最近几个月,OpenAI在生成式人工智能领域采取了更为稳健的迭代策略,而非追求突破性的飞跃。公司选择精细打磨和微调其工具,同时训练其当前领先模型GPT-4和GPT-4mini的后续产品。公司已经改进了提高模型整体性能的方法,并尽量减少模型偏离预定轨道的频率,但据某些基准测试,OpenAI似乎已经失去了在生成人工智能竞赛中的技术领先地位。
其中一个原因可能是高质量训练数据越来越难找到。
像大多数生成人工智能模型一样,OpenAI的模型是在大量网络数据的基础上训练的——许多创作者选择封锁其数据,因为他们担心自己的数据会被剽窃,或者他们无法得到应有的认可或报酬。根据人工智能内容检测与抄袭检测工具Originality.AI的数据,全球前1000个网站中有超过35%现在阻止OpenAI的网络爬虫。麻省理工学院数据来源计划研究也发现,大约25%的“高质量”数据已从用于训练AI模型的主要数据集中被排除。
研究机构EpochAI预测,若当前的数据访问屏蔽趋势持续下去,开发者将在2026年至2032年之间耗尽可用于训练生成人工智能模型的数据。这一点,加上对版权诉讼的恐惧,迫使OpenAI与出版商和各种数据经纪公司签订了成本高昂的许可协议。
据说,OpenAI已开发了一种推理技术,可以提高其模型在某些问题上的响应能力,特别是在数学问题上。公司的首席技术官米拉・穆拉蒂(MiraMurati)承诺,未来的OpenAI模型将具有“博士级”的智能。这一前景虽然充满希望,但也面临巨大的压力。据悉,OpenAI在培训其模型和雇佣高薪研究人员方面耗资数十亿美元。
时间将证明OpenAI在处理众多争议的同时是否能实现其宏伟目标。无论如何,放慢产品周期可能会有助于反驳那些声称OpenAI在追求更强大的生成人工智能技术时忽视了AI安全工作的说法。