世良情感网

AI能看懂电路图吗AI看物理图正确率低于一半多模态大模型真能“看懂”物理图像吗?

AI能看懂电路图吗AI看物理图正确率低于一半

多模态大模型真能“看懂”物理图像吗?

来自中山大学、ETH苏黎世、华为实验室和港大的研究团队,联合发布了一个全新的多模态物理推理基准:SeePhys,狠狠打了当前SOTA模型一记“物理暴击”——

不管是SOTA级MLLM还是纯语言模型,在图像依赖强的题目上普遍拉胯:

- 初中题正确率都不到70%;

- o4-mini在波动方程图、电路图上系统性识别失败;

- 小模型Qwen2.5-VL-3B重复输出率高达21%;

- 连Gemini-2.5-Pro都不到55%准确率。

再来看这个SeePhys基准,它的特点包括:

1. 跨度全:从初中物理到博士考题,涉及2000道题、2245张图,涵盖电磁学、量子物理等七大领域;

2. 图依赖强:专挑需要图表才能解答的问题,图表包括电路图、时空曲率图、费曼图等21类异构图表;

3. 模态耦合深:问题涉及图像、文本、公式等多模态内容,需要综合处理。

SeePhys也在ICML 2025的AI for MATH Workshop上发起了全球挑战,欢迎大家来“过招”。参赛链接:

项目主页:

论文地址: