中美AI挑战东京大学入学考试:双双合格,英语优异,数学欠佳

IT之家 2025-04-07 12:04:05

IT之家4月7日消息,据日经新闻4月5日报道,日本经济新闻与民间企业、大型补习班的联合研究发现,中美两国新型生成式AI已具备通过日本最难关东京大学理科3类入学考试的“学力”。两个模型在考察语言能力的英语中取得高分,但在数学中多次出现论证错误等问题。

此次测试让美国OpenAI的“o1”和中国AI初创公司DeepSeek的“R1”两个基础模型解答2025年度的东大入学考试题。AI初创公司LifePrompt(东京・新宿)输出了答案,并由大型预备学校河合塾的讲师进行评分。

大学入学共通考试和二次考试合计的理科得分(IT之家注:满分550分)中,o1获得了374分,R1获得了369分,两者均超过了东大在3月10日公布的理科3类合格最低分数线(368.7分)。

R1在理科1类和理科2类的共通考试中未达到合格最低分数线,但在其他科类中,与o1一起包括文科在内都“合格”了。

在二次考试中,得分率较高的是英语,o1和R1的得分率均超过了75%。河合塾负责英语的久恒秀雄讲师表示:“几乎没有单词和语法的错误,远远超过了东大考生的平均水平。”

数学方面,虽然最终答案正确的问题较多,但在图形和论证问题上多次出现论述错误和说明不足的情况。理科数学中,o1在120分满分中得了38分,R1得了49分。负责数学的香坂季京讲师指出:“这比合格者的平均分要低很多。”

自2011年开始的“机器人能否进入东京大学(东Robo)”项目的负责人、国立信息学研究所的新井纪子教授对此次考试结果评价道:“这是AI成长的一个重要里程碑。不过,AI有时会给出相当糟糕的答案,需要能够正确判断并熟练使用AI输出的人才。”

0 阅读:46