世良情感网

【[51星]EMMA-Bench/EMMA:一个强大的多模态推理基准测试工具,专

【[51星]EMMA-Bench/EMMA:一个强大的多模态推理基准测试工具,专为评估多模态大语言模型(MLLMs)的推理能力而设计。亮点:1. 涵盖数学、物理、化学和编程四大领域,共2788个问题;2. 提供细粒度标签,精准衡量模型能力;3. 支持多种模型评估,包括开源和闭源模型】

'EMMA: An Enhanced MultiModal ReAsoning Benchmark'

GitHub: github.com/EMMA-Bench/EMMA

多模态推理 AI基准测试 模型评估 AI创造营