Mistral发布PixtralLarge多模态AI模型:登顶复杂数学推理

中关村在线 2024-11-19 18:18:57

MistralAI公司近日发布了全新的多模态人工智能模型PixtralLarge。这款模型拥有1240亿参数,基于MistralLarge2,主要用于处理文本和图片。

PixtralLarge已在Mistral研究许可证和商业许可证下提供,适用于研究、教育以及商业用途。在多个标准的多模态基准测试中,该模型表现出色,在MathVista测试中的准确率达到69.4%,超过了所有竞争对手。

除此之外,PixtralLarge在ChartQA和DocVQA测试中同样表现出色,并且超越了GPT-4o和Gemini-1.5Pro。值得一提的是,该模型配备了123亿的多模态解码器和10亿的视觉编码器,支持128K的上下文窗口,能够处理至少30张高分辨率图像。

除了处理视觉数据外,PixtralLarge还在复杂推理和图表理解方面具备强大能力。

0 阅读:3

中关村在线

简介:最新最快最全的IT头条新闻资讯