鞭牛士报道,2月4日消息,据外电报道,分析师表明,与OpenAIChatGPT和其他机器学习平台等模型相比,DeepSeekAI的训练效率更高,此后,DeepSeekAI在过去一周人气飙升。
根据在其网站Stratechery上提供技术行业分析的BenThompson的报告,DeepSeek的设计受到诸多限制,最终导致机器学习所需的计算能力发生了创新。开发DeepSeek的初创公司位于中国,而中国正受到贸易禁运,这导致其无法获得美国跨国公司Nvidia生产的高质量半导体芯片。
由于主要使用质量较低的芯片,DeepSeek开发人员不得不采用各种人工智能(AI)优化技术,从而使他们的机器学习平台发挥出更大的性价比。
根据斯坦福大学2024年人工智能指数报告,DeepSeek开发人员声称,训练他们最新版本的AI花费了大约560万美元,而最新的ChatGPT4训练成本据称为7800万美元,谷歌的GeminiUltra成本为1.91亿美元。
当人工智能训练的成本大幅降低时,华盛顿大学圣路易斯分校的科学家和消费者都将受益。
麦凯维工程学院计算机科学与工程助理教授乌马尔·伊克巴尔(UmarIqbal)表示,仅他的实验室就需要花费数万美元才能使用这些平台,而来自中国初创公司的竞争可能会降低价格。
Stratechery的文章中提到了DeepSeek降低训练成本的一个例子,即他们的开发人员使用了一种名为蒸馏的方法,他们使用像ChatGPT这样的成熟生成式AI系统来“教”他们的系统如何完成工作。
McKelveyEngineering的博士生最近尝试了蒸馏来改进大型语言模型,而无需额外的训练。
「要让技术得到大规模采用,它们必须价格低廉。」伊克巴尔说。「这表明使用模型可以变得非常便宜。」
「总的来说,这是一个有趣的发展。它大大降低了人工智能的成本。」伊克巴尔补充道。「我们将能够进行实验,进行更多大规模实验。」
但主要研究课题是互联网安全和隐私的伊克巴尔警告说,未来还会出现其他陷阱。
对DeepSeek的担忧
要运行这些模型,人们需要访问大型硬件;这不是人们可以下载到手机上的东西。人工智能平台的工作方式是,一个人的机器和数据会传到云端的人工智能机器上——这就是他们可能失去对数据的控制的地方。
伊克巴尔表示:这是一个非常严重的问题。
人工智能系统可以实现庞大的监控基础设施,其中一些已经以搜索引擎的形式存在,可以追踪来自整个网络的用户数据,主要是为了促进电子商务。
「所有这些数据都会发送给不同的人工智能供应商,他们可以利用这些信息来分析用户,推断他们的兴趣,监视他们,甚至影响他们。」伊克巴尔说。
另一个担忧是人工智能语言模型越来越多地融入移动应用。人工智能的一个越来越被宣传的用途是规划假期。当人工智能使用各种应用程序来做这件事时,如果有任何恶意软件潜伏其中,它就有可能从用户那里收集更多的数据并操纵人工智能寻求的结果。
「当这些技术具有巨大潜力时,它们会发展得非常快。」伊克巴尔说。「你需要在设计中埋设护栏和保护措施。而人工智能系统却没有这样做。」