英特尔发布 OpenVINO 2025.0:新增图像生成场景与 DeepSeek 蒸馏模型支持

xxn 阅读:45331 2025-02-15 14:01:25 评论:0
特别感谢IT之家网友 有鲫雪狐 的宝贵线索!

IT之家2月15日消息,最新消息来自英特尔开发者专区:2025年首个OpenVINO版本(2025.0)于14日正式面世,此次更新重点在于性能优化及对更多生成式AI模型的支持,同时针对英特尔神经处理单元(NPU)进行了重要的优化。

官方介绍,OpenVINO 2025.0版本正式支持 FLUX.1图像生成模型(包括Dev与Schnell变体),用户可在英特尔CPU/GPU上通过GenAI流水线进行执行。开发者目前可以借助Optimum-Intel导出Flux模型,并利用Text2ImagePipeline生成图像。针对Flux模型在精度变化方面的敏感性,我们进行了深度优化,以确保图像生成的性能和准确度。

例如,INT8量化的FLUX.1-dev模型在应用Yarn风格LoRA前后的比较如下(提示词:"albert einstein, yarn art style",初始种子=420,迭代次数=20):

此次版本还新增了对Image2Image与Inpainting的支持。

  • Image2Image:通过图像和文本的组合生成新图像,提高输出的可控性;

  • Inpainting:允许通过掩码图像替换输入图像的特定区域,实现局部内容的再生。

    这两种流水线都支持LoRA适配器,满足开发者的定制化需求。

新版本在LLMPipeline API中引入了提示词查找解码的预览功能,这是推测解码的一种简化,使用直接查找机制取代传统的草稿模型。这将有助于在高相似请求中大幅度降低生成延迟。例如,当对一组文档进行问答时,可以明显看到性能优势,因为答案是基于作为提示词一部分的文档生成的。

英特尔透露,当前正致力于支持和验证最新模型,诸如Mistral-7B-Instruct-v0.2、Qwen2.5,“我们同样支持基于LLama和Qwen结构的DeepSeek蒸馏模型。”

此外,2025.0版本首次实现了 NPU加速支持,开发者可通过PyTorch的 torch.compile接口调用英特尔NPU算力。OpenVINO现已在CPU和GPU上得到支持,且在性能方面与原生OpenVINO推理非常接近。以下为启用步骤:

广告说明:文章中包含的对外链接(如超链接、二维码、口令等)为传达更多信息所用,旨在节省信息筛选时间,结果仅供参考。

声明

1.本站遵循行业规范,任何转载的稿件都会明确标注作者和来源;2.本站的原创文章,请转载时务必注明文章作者和来源,不尊重原创的行为我们将追究责任;3.作者投稿可能会经我们编辑修改或补充。

搜索
排行榜
关注我们

扫一扫关注我们,了解最新精彩内容