MistralAI公司近日发布了全新的多模态人工智能模型PixtralLarge。这款模型拥有1240亿参数,基于MistralLarge2,主要用于处理文本和图片。
PixtralLarge已在Mistral研究许可证和商业许可证下提供,适用于研究、教育以及商业用途。在多个标准的多模态基准测试中,该模型表现出色,在MathVista测试中的准确率达到69.4%,超过了所有竞争对手。
除此之外,PixtralLarge在ChartQA和DocVQA测试中同样表现出色,并且超越了GPT-4o和Gemini-1.5Pro。值得一提的是,该模型配备了123亿的多模态解码器和10亿的视觉编码器,支持128K的上下文窗口,能够处理至少30张高分辨率图像。
除了处理视觉数据外,PixtralLarge还在复杂推理和图表理解方面具备强大能力。