英特尔发布OpenVINO2025.0:新增图像生成场景与DeepSeek支持

IT之家 2025-02-15 13:27:38

IT之家2月15日消息,IT之家从英特尔开发人员专区获悉,2025年首个OpenVINO版本(2025.0)于14日正式发布,本次更新聚焦性能提升、更多生成式AI模型的支持,并针对英特尔神经处理单元(NPU)推出关键优化。

官方表示:OpenVINO2025.0版本正式支持FLUX.1图像生成模型(含Dev与Schnell变体),可在英特尔CPU/GPU上通过GenAI流水线运行。开发者现可通过Optimum-Intel导出Flux模型,并结合Text2ImagePipeline生成图像。针对Flux模型对精度变化非常敏感的特点,我们进行了深度优化,确保图像生成性能与准确度兼得。

例如,INT8量化版FLUX.1-dev模型在应用Yarn风格LoRA前后的对比如下(提示词:"alberteinstein,yarnartstyle",初始种子=420,迭代次数=20):

此次还加入了Image2Image与Inpainting的支持。

Image2Image:以图像+文本为输入生成新图像,提升结果可控性;

Inpainting:通过掩码图像替换输入图像的指定区域,支持局部内容再生。

两种流水线均兼容LoRA适配器,满足定制化需求。

本次新版本在LLMPipelineAPI中引入了对提示词查找解码的预览支持,这是对推测解码的简化,它在输入提示词本身中用直接查找机制取代了传统的草稿模型。这有助于在具有高相似性的请求的情况下显著减少生成延迟。例如,通过对一组文档的问答可以观察到性能优势,因为答案将根据作为提示词本身一部分的文档来生成。

英特尔称目前正在努力支持和验证最新模型,包括Mistral-7B-Instruct-v0.2、Qwen2.5,“当然我们也支持基于LLama和Qwen架构的DeepSeek蒸馏模型。”

此外,2025.0版本首次实现NPU加速支持,开发者可通过PyTorch的torch.compile接口调用英特尔NPU算力。OpenVINO已经在CPU和GPU上得到支持,并且在性能方面非常接近原生OpenVINO推理。如下为启用方式:

0 阅读:2