世良情感网

【[51星]EMMA-Bench/EMMA：一个强大的多模态推理基准测试工具，专

2025-05-21 14:11:09 爱生活爱珂珂科技

【[51星]EMMA-Bench/EMMA：一个强大的多模态推理基准测试工具，专为评估多模态大语言模型（MLLMs）的推理能力而设计。亮点：1. 涵盖数学、物理、化学和编程四大领域，共2788个问题；2. 提供细粒度标签，精准衡量模型能力；3. 支持多种模型评估，包括开源和闭源模型】

'EMMA: An Enhanced MultiModal ReAsoning Benchmark'

GitHub: github.com/EMMA-Bench/EMMA

多模态推理 AI基准测试模型评估 AI创造营

阅读：0 点赞：0