马斯克也认为用于训练AI的真实世界数据所剩无几未来只能靠合成数据

小良杂谈 2025-01-12 14:01:40

本周埃隆马斯克与 STAGWELL 董事长在 X/Twitter 进行直播时埃隆马斯克表示,我们现在基本上已经耗尽人类在人工智能训练方面积累的全部知识,这基本上发生在 2024 年。

有鉴于人类自己产生的数据已经被耗尽,所以埃隆马斯克认为合成数据也就是由人工智能模型本身生成的数据是未来的发展方向,补充的唯一方法就是使用合成数据,有了合成数据后人工智能就会自我评分并经历自我学习的过程。

值得注意的是由于无法获取到最后多的真实世界新数据,包括埃隆马斯克的 xAI、微软、Meta、OpenAI 和 Anthropic 等科技巨头都已经开始使用合成数据训练 AI 模型。

市场调查公司 Gartner 的预计则是在 2024 年用于人工智能和分析项目中的数据可能有高达 60% 都是合成的而非人类产生的真实数据。如果用于训练的合成数据本身存在偏见和局限性,那么训练出来的人工智能模型也同样会存在这样的缺点或受到影响,最终影响到人工智能模型的质量。

0 阅读:5
小良杂谈

小良杂谈

每日更新你关注的科技资讯