AI能看懂电路图吗AI看物理图正确率低于一半
多模态大模型真能“看懂”物理图像吗?
来自中山大学、ETH苏黎世、华为实验室和港大的研究团队,联合发布了一个全新的多模态物理推理基准:SeePhys,狠狠打了当前SOTA模型一记“物理暴击”——
不管是SOTA级MLLM还是纯语言模型,在图像依赖强的题目上普遍拉胯:
- 初中题正确率都不到70%;
- o4-mini在波动方程图、电路图上系统性识别失败;
- 小模型Qwen2.5-VL-3B重复输出率高达21%;
- 连Gemini-2.5-Pro都不到55%准确率。
再来看这个SeePhys基准,它的特点包括:
1. 跨度全:从初中物理到博士考题,涉及2000道题、2245张图,涵盖电磁学、量子物理等七大领域;
2. 图依赖强:专挑需要图表才能解答的问题,图表包括电路图、时空曲率图、费曼图等21类异构图表;
3. 模态耦合深:问题涉及图像、文本、公式等多模态内容,需要综合处理。
SeePhys也在ICML 2025的AI for MATH Workshop上发起了全球挑战,欢迎大家来“过招”。参赛链接:
项目主页:
论文地址: