省略docker和模型下载,可参考我的其他文章。
基于mindie镜像部署,首先解压并load 镜像。
前往昇腾社区/开发资源下载适配本模型的镜像包mindie:2.0.T17.B010-800I-A2-py3.11-openeuler24.03-lts-aarch64.tar.gz
docker load -i mindie_2.0.T17.B010-800I-A2-py3.11-openeuler24.03-lts-aarch64.tar.gz(下载的镜像名称与标签)
完成加载镜像后,请使用docker images命令确认查找具体镜像名称与标签。
当前容器支持TP=1/2/4/8推理
新建容器
docker run -it -d --net=host --shm-size=1g \
--name qwen314b \
--device=/dev