AI能看懂电路图吗AI看物理图正确率低于一半多模态大模型真能“看懂”物理图像吗？

AI能看懂电路图吗AI看物理图正确率低于一半

多模态大模型真能“看懂”物理图像吗？

来自中山大学、ETH苏黎世、华为实验室和港大的研究团队，联合发布了一个全新的多模态物理推理基准：SeePhys，狠狠打了当前SOTA模型一记“物理暴击”——

不管是SOTA级MLLM还是纯语言模型，在图像依赖强的题目上普遍拉胯：

- 初中题正确率都不到70%；

- o4-mini在波动方程图、电路图上系统性识别失败；

- 小模型Qwen2.5-VL-3B重复输出率高达21%；

- 连Gemini-2.5-Pro都不到55%准确率。

再来看这个SeePhys基准，它的特点包括：

1. 跨度全：从初中物理到博士考题，涉及2000道题、2245张图，涵盖电磁学、量子物理等七大领域；

2. 图依赖强：专挑需要图表才能解答的问题，图表包括电路图、时空曲率图、费曼图等21类异构图表；

3. 模态耦合深：问题涉及图像、文本、公式等多模态内容，需要综合处理。

SeePhys也在ICML 2025的AI for MATH Workshop上发起了全球挑战，欢迎大家来“过招”。参赛链接：

项目主页：

论文地址：

世良情感网