华为推出DeepSeek系列模型，支持快速推理部署

时间：2025-02-08 08:10

小编：小世评选

近日，华为正式在昇腾社区上线了其最新的DeepSeek系列模型，包括DeepSeek-R1、DeepSeek-V3、DeepSeek-V2和Janus-Pro。这些模型旨在为开发者和企业提供高效、灵活的推理解决方案，支持快速部署，推动各类智能应用的开发。

随着人工智能的迅猛发展，企业在模型推理速度和效率方面的需求不断上升。传统的推理过程往往受到计算能力和资源限制的影响，而华为的DeepSeek系列模型则通过优化设计，实现了快速推理的目标。该系列模型不仅支持GPU和NPU（华为自家神经处理器）的计算，用户可以根据实际需求进行灵活选择，借助该技术，企业能够在复杂的应用场景中，快速获得推理结果。

为方便开发者使用DeepSeek模型，华为提供了详细的使用指导。开发者可以通过GitHub与华为的MindIE社区进行模型的下载和部署。以下为模型调用的基本步骤：

GPU环境下的模型调用步骤：

1. 克隆DeepSeek-V3的代码库：

```bash

git clone https://github/deepseek-ai/DeepSeek-V3.git

cd DeepSeek-V3/inference/

```

2. 使用Python脚本进行数据转换：

```bash

python fp8_cast_bf16.py --input-fp8-hf-path /path/to/DeepSeek-V3 --output-bf16-hf-path /path/to/deepseek-v3-bf16

```

NPU环境下的模型调用步骤：

1. 克隆DeepSeek-V3的NPU特定代码库：

```bash

git clone https://modelers.cn/MindIE/deepseekv3.git

cd NPU_inference/

```

2. 同样，使用Python脚本进行数据转换：

```bash

python fp8_cast_bf16.py --input-fp8-hf-path /path/to/DeepSeek-V3 --output-bf16-hf-path /path/to/deepseek-v3-bf16

```

在完成模型的调用后，开发者需要从昇腾社区下载适配DeepSeek-V3的镜像包，命令如下：

```bash

docker load -i mindie:1.0.T71-800I-A2-py311-ubuntu22.04-arm64

```

使用`docker images`命令确认镜像的名称与标签。随着准备工作的完成，开发者需确保在信任的来源获取权重文件，并按以下步骤配置：

1. 修改模型文件夹的属组及权限：

```bash

chown -R 1001:1001 /path-to-weights/deepseekv3

chmod -R 750 /path-to-weights/deepseekv3

```

DeepSeek系列模型还引入了一些典型的优化配置，比如启用内存池扩展段功能，有效提升虚拟内存特性，具体命令为：

```bash

export PYTORCH_NPU_ALLOC_CONF=expandable_segments:True

```

在应用配置前，开发者可以进一步调优显存使用，设置显示内存比，例如：

```bash

export NPU_MEMORY_FRACTION=0.95

```

，执行服务启动命令，若出现“Daemon start success!”的提示，则表明服务成功启动。

DeepSeek系列模型的推出，不仅是华为在人工智能领域的一次重要实践，也是对提升AI应用推理效率及性能的积极探索。这些模型的灵活部署方式将极大地降低用户在实际应用中的门槛，让更多企业和开发者能够独立探索和开发智能应用。

伴随着AI技术的不断进步，DeepSeek模型也将不断迭代更新，华为致力于通过前沿技术为用户提供更好的服务和更高的灵活性，同时希望与开发者社区共同推动智能化应用的发展，为各行各业的数字化转型提供有力支持。

在未来，华为将继续关注技术发展趋势，秉持开放、合作的理念，与全球开发者携手并进，共同构建智能时代的美好愿景。

华为推出DeepSeek系列模型，支持快速推理部署

精品推荐

相关文章