英特尔发布 OpenVINO 2025.0：新增图像生成场景与 DeepSeek 蒸馏模型支持

xxn 阅读：45331 2025-02-15 14:01:25 评论：0

特别感谢IT之家网友有鲫雪狐的宝贵线索！

IT之家2月15日消息，最新消息来自英特尔开发者专区：2025年首个OpenVINO版本（2025.0）于14日正式面世，此次更新重点在于性能优化及对更多生成式AI模型的支持，同时针对英特尔神经处理单元（NPU）进行了重要的优化。

官方介绍，OpenVINO 2025.0版本正式支持 FLUX.1图像生成模型（包括Dev与Schnell变体），用户可在英特尔CPU/GPU上通过GenAI流水线进行执行。开发者目前可以借助Optimum-Intel导出Flux模型，并利用Text2ImagePipeline生成图像。针对Flux模型在精度变化方面的敏感性，我们进行了深度优化，以确保图像生成的性能和准确度。

例如，INT8量化的FLUX.1-dev模型在应用Yarn风格LoRA前后的比较如下（提示词："albert einstein, yarn art style"，初始种子=420，迭代次数=20）：

此次版本还新增了对Image2Image与Inpainting的支持。

Image2Image：通过图像和文本的组合生成新图像，提高输出的可控性；
Inpainting：允许通过掩码图像替换输入图像的特定区域，实现局部内容的再生。
这两种流水线都支持LoRA适配器，满足开发者的定制化需求。

新版本在LLMPipeline API中引入了提示词查找解码的预览功能，这是推测解码的一种简化，使用直接查找机制取代传统的草稿模型。这将有助于在高相似请求中大幅度降低生成延迟。例如，当对一组文档进行问答时，可以明显看到性能优势，因为答案是基于作为提示词一部分的文档生成的。

英特尔透露，当前正致力于支持和验证最新模型，诸如Mistral-7B-Instruct-v0.2、Qwen2.5，“我们同样支持基于LLama和Qwen结构的DeepSeek蒸馏模型。”

此外，2025.0版本首次实现了 NPU加速支持，开发者可通过PyTorch的 torch.compile接口调用英特尔NPU算力。OpenVINO现已在CPU和GPU上得到支持，且在性能方面与原生OpenVINO推理非常接近。以下为启用步骤：

广告说明：文章中包含的对外链接（如超链接、二维码、口令等）为传达更多信息所用，旨在节省信息筛选时间，结果仅供参考。

声明

1.本站遵循行业规范，任何转载的稿件都会明确标注作者和来源；2.本站的原创文章，请转载时务必注明文章作者和来源，不尊重原创的行为我们将追究责任；3.作者投稿可能会经我们编辑修改或补充。