大型语言模型(LLM)是在对数百万份文档进行训练后创建的,它同样是像ChatGPT这样的人工智能聊天机器人的基础模型。该模型拥有数学向量,可将单词、图片等相互出现的概率联系起来。例如,"冰 "出现在 "奶油 "旁边的可能性要远远大于它出现在 "石头 "旁边的可能性。然而,大型LLM需要消耗大量的计算能力和资源来回答用户的问题,这对用户来说成本很高。优化精简后LLM可以使其体积更小、成本更便宜、也更环保,但代价是答案的准确性会降低。
在与GPT-4o的直接对比中GPT-4o mini输出的答案准确率的确始终都要低。但是与2022年发布的GPT-3.5 Turbo对比后,GPT-4o mini的表现一直更准确一些。在各种学术界的人工智能基准测试中,该模型大约有60%~80%准确率。
重要的是,GPT-4o的价格为5美元/100 万个输入词块和 15美元/100 万个输出词块,而GPT-4o mini的价格为0.15 美元/100 万个输入词块和0.60美元/100万个输出词块。这比便宜得多。这个价格已经很便宜了,不过mistral-embed除外。
GPT-4o mini的输入上下文窗口只有128K字节,因此对大量文字内容比如商业和法律文件的分析会受到问题字数的限制。输出窗口限制为16K字节。该模型的知识模型获取截止到2023 年10月,因此在这个时间之前的模型数据会缺失,也就无法回答和分析基于这个时间之后的事情。