
昇腾FAQ
文章平均质量分 95
昇腾高频共性问题
昇腾知识体系
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
昇腾FAQ-A01-硬件相关
我们从昇腾全年技术工单中提炼了1000条最常被问到的问题,其中硬件相关FAQ 166个,涵盖驱动安装、版本兼容性、系统适配等常见场景。关键问题包括:310系列芯片不支持训练(需改用910系列)、驱动与固件版本不匹配导致初始化失败(按先固件后驱动的顺序升级)、Ubuntu 24.04等新系统兼容性问题(建议使用LTS版本)、虚拟网卡冲突影响SSH连接(需禁用相关服务)等。特别提醒用户需严格遵循版本配套关系,并参考官方兼容性列表。原创 2025-07-11 16:39:21 · 829 阅读 · 0 评论 -
昇腾FAQ-A02-镜像与资源下载相关
我们从昇腾全年技术工单中提炼了1000条最常被问到的问题,其中与镜像仓和资源下载相关的FAQ 165个,涵盖从权限申请到实际部署中的各类典型错误。1.镜像下载:包括权限申请流程、架构不匹配(x86/ARM)、网络代理配置等,建议检查Docker登录状态和平台架构。2.部署运行:涉及NPU卡ID分配、依赖缺失(如libhccl.so)、硬件兼容性等,可通过环境变量调整和权限检查解决。3.性能优化:针对推理延迟、并发限制等问题,推荐调整超时设置和输入输出参数。4.系统兼容性:强调OS版本与硬件匹配的重要性。原创 2025-07-11 16:46:54 · 538 阅读 · 0 评论 -
昇腾FAQ-A06-行业应用MindX相关
我们从昇腾全年技术工单中提炼了1000条最常被问到的问题,其中与行业应用MindX相关的FAQ 119个,涵盖Ascend设备配置、MindX工具使用、Kubernetes调度等。包括:1.硬件测试与配置:如P2P测试失败、NPU标签配置、设备监控等。2.性能优化:针对MindIE服务超时、视频解码混乱等问题,提供并发控制、资源分配优化方案。3.环境部署问题:包括Ascend安装编码错误、Docker运行时安装等。4.容器化应用:涉及K8s调度、Pod资源释放、权限配置等部署,给出具体命令和YAML配置原创 2025-07-12 12:00:39 · 962 阅读 · 0 评论 -
昇腾FAQ-A08-工具链相关
我们从昇腾全年技术工单中提炼了1000条最常被问到的问题,其中与工具链MindStudio相关的FAQ 29个,涵盖模型推理、性能分析、环境配置等方面。例如,模型转换时ONNX导出建议使用标准PyTorch方法,OM模型转换需启用dymShape_range参数支持动态输入;区分profiling数据收集与profiler工具使用,设置profiler_level参数可采集NPU通信数据。原创 2025-07-13 10:02:37 · 381 阅读 · 0 评论 -
昇腾FAQ-A09-推理部署相关
从昇腾全年技术工单中提炼了1000条经常被问的问题,其中与推理部署相关的FAQ 132个。请求超时:调整并发数或增加超时限制。环境冲突:检查并升级依赖库(如jedi、pandas)。 多机部署错误:确保ranktable文件中的设备ID唯一。 资源占用过高:优化模型配置(如cpuMemSize、batch_size)。 容器权限问题:调整K8S配置或检查目录权限。 模型兼容性:确认昇腾适配的模型列表。 量化问题:使用官方量化工具或升级CANN版本。原创 2025-07-14 09:37:19 · 1184 阅读 · 0 评论 -
昇腾FAQ-A12-DeepSeek部署相关
从昇腾全年技术工单中提炼了1000条经常被问的问题,其中与Deepseek部署相关的FAQ 31个。内容涵盖硬件资源配置(如Atlas 300I Duo卡显存分配)、性能优化(并发控制、NPU利用率提升)、环境配置(容器部署权限、驱动版本兼容)以及多机训练设置等场景。关键建议包括:合理调整并发参数避免性能瓶颈,确保驱动版本与硬件匹配,正确配置容器挂载路径,以及参考官方文档进行性能调优。原创 2025-07-14 09:53:35 · 1173 阅读 · 0 评论 -
昇腾FAQ-A19-训练场景相关
从昇腾全年技术工单中提炼了1000条经常被问的问题,其中与训练场景相关FAQ 94个。涵盖设备配置、性能优化、兼容性等。1.设备配置:如单机多容器通信、NPU设备指定、分布式训练初始化等解决方案。2.性能优化技巧:针对NPU利用率不足、运行速度慢、显存OOM等问题的优化建议。3.API兼容性:处理torch特定API不支持、模型迁移异常等情况。4.环境配置:解决依赖缺失、版本不匹配、环境变量设置等安装部署问题。5.LLM部署:Qwen等大模型在Atlas服务器上的部署建议。原创 2025-07-15 09:39:44 · 1248 阅读 · 0 评论 -
昇腾FAQ-A24-CANN相关
想知道昇腾,不如先了解CANN,看它能否挑战CUDA。我们从昇腾全年工单中提炼了1000条FAQ,其中与CANN相关的就有271个;涵盖了CANN版本适配、AscendC算子开发、分布式训练、多机通信等常见场景。包括:如何确认Atlas设备适配的CANN版本;解决自定义算子空指针错误的方法;多卡训练中报错的排查步骤;HCCL集合通信库参数校验失败解决方案;多线程环境下ACL Lite API的使用方法;以及模型转换、加载和推理过程中的常见问题处理建议,并提供了相关命令示例和代码片段作为参考。原创 2025-07-15 09:43:45 · 1770 阅读 · 0 评论