英特尔发布 OpenVINO 2025.0:新增图像生成场景与 DeepSeek 蒸馏模型支持
IT之家2月15日消息,最新消息来自英特尔开发者专区:2025年首个OpenVINO版本(2025.0)于14日正式面世,此次更新重点在于性能优化及对更多生成式AI模型的支持,同时针对英特尔神经处理单元(NPU)进行了重要的优化。
官方介绍,OpenVINO 2025.0版本正式支持 FLUX.1图像生成模型(包括Dev与Schnell变体),用户可在英特尔CPU/GPU上通过GenAI流水线进行执行。开发者目前可以借助Optimum-Intel导出Flux模型,并利用Text2ImagePipeline生成图像。针对Flux模型在精度变化方面的敏感性,我们进行了深度优化,以确保图像生成的性能和准确度。
例如,INT8量化的FLUX.1-dev模型在应用Yarn风格LoRA前后的比较如下(提示词:"albert einstein, yarn art style",初始种子=420,迭代次数=20):
此次版本还新增了对Image2Image与Inpainting的支持。
Image2Image:通过图像和文本的组合生成新图像,提高输出的可控性;
Inpainting:允许通过掩码图像替换输入图像的特定区域,实现局部内容的再生。
这两种流水线都支持LoRA适配器,满足开发者的定制化需求。
新版本在LLMPipeline API中引入了提示词查找解码的预览功能,这是推测解码的一种简化,使用直接查找机制取代传统的草稿模型。这将有助于在高相似请求中大幅度降低生成延迟。例如,当对一组文档进行问答时,可以明显看到性能优势,因为答案是基于作为提示词一部分的文档生成的。
英特尔透露,当前正致力于支持和验证最新模型,诸如Mistral-7B-Instruct-v0.2、Qwen2.5,“我们同样支持基于LLama和Qwen结构的DeepSeek蒸馏模型。”
此外,2025.0版本首次实现了 NPU加速支持,开发者可通过PyTorch的 torch.compile接口调用英特尔NPU算力。OpenVINO现已在CPU和GPU上得到支持,且在性能方面与原生OpenVINO推理非常接近。以下为启用步骤:
广告说明:文章中包含的对外链接(如超链接、二维码、口令等)为传达更多信息所用,旨在节省信息筛选时间,结果仅供参考。
1.本站遵循行业规范,任何转载的稿件都会明确标注作者和来源;2.本站的原创文章,请转载时务必注明文章作者和来源,不尊重原创的行为我们将追究责任;3.作者投稿可能会经我们编辑修改或补充。