继去年发布惊艳全球的,搭载GPT-3.5的ChatGPT后,还没等同行缓过神来,OpenAI就再次光速革新,于3月14日宣布推出GPT-4,并将其实装在ChatGPT,同时开放了GPT-4的API。
OpenAI工程师自豪地宣称,GPT-4将是“世界第一款高体验、强能力的现金AI系统”。那么与之前的GPT-3.5相比,它在哪些方面有所进步?在应用层面上,又会有哪些亮点?
高级推理能力:更快更强的超级“学霸”
根据官方介绍,GPT-4目前虽然在现实场景中的能力可能不如人类,但是在各类专业和学术考试中的表现已经达到了明显超于常人的能力水平。OpenAI在一系列不同的基准上测试了GPT-4,包括最初为人类设计的模拟考试(并且没有为这些考试进行特定的“培训”)。
来源:OpenAI;翻译:DeepL
结果显示,大多数考试中GPT-4的成绩都超过了GPT-3.5。它甚至通过了模拟的统一律师资格考试,并且分数在考生中排名前10%。
同时,为了初步了解GPT-4在非英语语言中的能力,OpenAI使用MMLU基准——这是跨越57个学科的多项选择问题,并将其翻译成多种语言,包括拉脱维亚语、威尔士语和斯瓦西里语等不常见的语言,以此来观察GPT-4的表现。结论是GPT-4表现远远优于以往的语言模型。