IBM推出Granite3.2:全新企业级多模态及推理的AI模型

美通社资讯 2025-03-04 21:46:44

Granite3.2是小型的AI模型,通过对开发人员友好的授权条款,提供推理、视觉和护栏功能

更新后的Granite时间序列模型可提供长期预测,参数少于10M;适用于金融与经济趋势分析、供应链需求预测,以及零售业的季节性库存规划等用例

北京,2025年3月4日--IBM于2月底推出其Granite大型语言模型家族的最新一代产品Granite3.2,持续推动小型、高效、企业专用的AI,为实际应用创造效益。

所有Granite3.2模型均采用宽松的Apache2.0开源授权条款,可在HuggingFace下载。部分模型现已在IBMwatsonx.ai、Ollama、Replicate和LMStudio上提供,预计不久将支援RHELAI1.5,为企业与开源社区注入更强大的AI能力。

主要亮点

全新视觉语言模型:专为理解文件任务而设计,在关键企业基准测试DocVQA、ChartQA、AI2D和OCRBench[1]中,表现可媲美甚至超越更大规模的模型(如Llama3.211B和Pixtral12B)。除了强大的训练数据外,IBM也利用其开源Docling工具包处理8千5百万份PDF文件,并生成2千6百万个合成问答配对,提升视觉语言模型在处理大量文件工作流时的能力。

增强推理功能:Granite3.2的2B与8B模型加入了「思维链」(ChainofThought,CoT)推理机制,且使用者可以开启或关闭推理功能以优化效率。通过这项能力,8B模型在ArenaHard和AlpacaEval等指令遵循基准测试中的表现[2],比前一代优异比例达到两位数,且不影响其他领域的安全性或性能。此外,通过创新的推理扩展方法,Granite3.28B模型可以调整至接近Claude3.5Sonnet或GPT-4o在数学推理基准(如AIME2024和MATH500[3])上的表现。

GraniteGuardian安全模型更轻巧:在保持Granite3.1Guardian模型性能的同时,模型尺寸减少三成。此外,Granite3.2系列还引入了语言化信心评估(VerbalizedConfidence)新功能,可提供更精细的风险评估,帮助安全监测系统识别不确定性。

IBM持续推动企业专用的小型AI模型策略,并已在测试中展现高效能。例如,Granite3.18B模型在Salesforce大型语言模型CRM基准测试中获得高分,显示其在实际应用中的准确度和可靠性。

IBMGranite模型家族拥有广大的合作伙伴生态体系,许多领先的软件公司已将Granite模型嵌入其技术。Granite3.2是IBM在推动企业专用小型AI方面的重要进展,体现了IBM致力于提供小型、高效、实用AI的产品策略。

CrushBank首席技术官DavidTan表示:"在CrushBank,我们亲眼目睹了IBM开放、高效的人工智能模型如何为企业人工智能带来真正的价值--在性能、成本效益和可扩展性之间实现适当的平衡。Granite3.2通过新的推理功能更进一步,我们很高兴能在构建新的代理(智能体)解决方案时探索这些功能。"

Granite3.2是IBM产品组合和战略发展的重要一步,旨在为企业提供小型实用的AI。虽然思维链在推理任务中表现强大,但它需要大量计算资源,并非所有任务都必须启用。因此,IBM在Granite3.2模型中加入了程式化开关功能,使用者可以根据需求开启或关闭推理模式;模型可在不启用推理的情况下运行较简单的任务,以降低不必要的计算成本。

此外,其他推理技术(例如推理扩展InferenceScaling)已显示Granite3.28B模型能够在标准数学推理基准测试中,媲美甚至超越更大模型的性能。持续发展这项推理技术也是IBM研究团队的重点方向[4],以进一步提升AI的效能与应用范围。

除了Granite3.2的指令、视觉和防护模型之外,IBM也推出了新一代TinyTimeMixers(TTM)时间序列模型,这些模型的参数少于1千万,具备长期预测能力,可进行长达两年的长期预测。这些模型为长期趋势分析提供强大工具,适用于金融与经济趋势分析、供应链需求预测,以及零售业的季节性库存规划。

IBMAI研究副总裁SriramRaghavan表示:"AI的下一个时代将聚焦效率、整合与实际应用的影响力—企业应该能够在不过度消耗计算资源的情境下,取得强大的AI效益。IBM最新的Granite模型发展专注于开放式解决方案,逐步推动AI的普及,使其更具成本效益,为现代企业创造更大价值。"

欲了解Granite3.2的技术细节,请参阅相关技术文章。

关于IBM

IBM是全球领先的混合云、人工智能及企业服务提供商,帮助超过175个国家和地区的客户,从其拥有的数据中获取商业洞察,简化业务流程,降低成本,并获得行业竞争优势。金融服务、电信和医疗健康等关键基础设施领域的超过4000家政府和企业实体依靠IBM混合云平台和RedHatOpenShift快速、高效、安全地实现数字化转型。IBM在人工智能、量子计算、行业云解决方案和企业服务方面的突破性创新为我们的客户提供了开放和灵活的选择。对企业诚信、透明治理、社会责任、包容文化和服务精神的长期承诺是IBM业务发展的基石。了解更多信息,请访问:

媒体联络人:

郭韬

[1]视觉模型(VisionModel)的基准测试结果可在IBM技术文章《IBMGranite3.2:推理、视觉、预测与更多应用》(2025年2月26日发布)中查阅。

[2]指令模型(InstructModel)的基准测试结果可在IBM技术文章《IBMGranite3.2:推理、视觉、预测与更多应用》(2025年2月26日发布)中查阅。

[3]推理扩展(InferenceScaling)的基准测试结果可在IBM技术研究部落格《Granite3.2中的推理:利用推理扩展技术》(2025年2月26日发布)中查阅。

[4]推理扩展技术在Granite3.2中的应用,IBM技术研究部落格,2025年2月26日发布

0 阅读:0
美通社资讯

美通社资讯

美通社是全球领先的企业和机构新闻通讯机构。