英特尔发布2025年首个OpenVINO版本:聚焦性能与生成式AI支持
时间:2025-02-21 13:10
小编:小世评选
近日,英特尔在其开发者专区正式发布了2025年第一个OpenVINO版本(2025.0),该版本于2月14日推出,标志着英特尔在人工智能领域再度迈出了重要一步。此次更新的重点是提升性能和增强对生成式AI模型的支持,同时为英特尔神经处理单元(NPU)进行了关键的优化,预计将为开发者与企业用户提供更加高效的AI解决方案。
OpenVINO(Open Visual Inference and Neural Network Optimization)是英特尔推出的一款开源工具包,旨在帮助开发者优化深度学习模型的推理性能。此次发布的2025.0版本,不仅支持英特尔的CPU和GPU,还首次对NPU提供了全面的支持,满足了更多用户在不同硬件环境下的需求。
官方表示,2025.0版本现已支持包括Dev和Schnell变体在内的多种型号,开发者能够通过GenAI流水线在英特尔硬件上实现高效的AI推理。这一版本使开发者能够更加便捷地使用Optimum-Intel工具导出Flux模型,并结合Text2ImagePipeline实现图像生成。这对于需要快速生成高质量图像的应用场景来讲,是一项重要的技术进步。
此次更新中,英特尔针对Flux模型的特性进行了深度优化,尤其是在模型对精度变化敏感的情况下,依然能够保证图像生成的高性能与高准确度。例如,在INT8量化版的FLUX.1-dev模型中,通过应用Yarn风格的LoRA框架,开发者可以根据特定提示词生成相应的图像,例如通过提示词“albert einstein, yarn art style”生成具有艺术感的图像,从而提升了生成结果的可控性和创造性。
新版本还引入了一种新的生成机制——图像与文本联合输入。用户可以将图像与文本作为输入,以生成新的图像。这一特性大大提高了生成结果的可控性,使得开发者可以更多地掌握生成的内容,满足特定的需求。
值得注意的是,2025.0版本还支持通过掩码图像替换输入图像的特定区域进行局部内容再生,满足开发者在生成个性化内容时的需求。这一特性与LoRA适配器的兼容性也为开发者提供了更多的灵活性,能够灵活应对不同的项目要求。
在用户体验方面,英特尔借助LLMPipeline API引入了对提示词查找解码的预览支持。这一创新大大简化了推测解码过程,采用直接查找机制取代了传统草稿模型,借此显著降低了生成延迟。尤其在处理相关性较高的请求时,通过对文档的快速问答可以获得更高的性能优势。答案的生成将基于提示词本身中的文档,更加直观、快速。
英特尔表示,当前正在积极支持并验证多种最新的模型,包括Mistral-7B-Instruct-v0.2和Qwen2.5等,同时也承诺将持续扩展对其他先进模型的支持。这也表明了英特尔对推动AI技术发展的决心与不断创新的能力。
更值得一提的是,2025.0版本的发布首次实现了通过PyTorch的torchpile接口调用英特尔NPU计算资源的功能。这一更新极大地提升了NPU的使用灵活性和性能,令开发者能够在CPU和GPU上进行高效推理,同时达到接近原生OpenVINO的推理性能。
英特尔2025年首个OpenVINO版本的推出,不仅为开发者提供了更低门槛的AI战场,更是通过具体的性能优化与生成式AI支持推动了整个AI产业链的发展。随着AI技术的不断进步,OpenVINO将成为越来越多企业在智能应用领域实现技术突破与商业转型的重要工具。对于开发者和企业掌握这一工具,将大大提高在快速变化的市场环境中的竞争力与创新能力。