GTX 10系类显卡生成的容器CUDA10.2、cudnn7、Pytorch1.8.0、python=3.8可以训练。
把镜像加载到RTX 20系类显卡容器训练出现上述错误:RuntimeError: cuDNN error: CUDNN_STATUS_NOT_INITIALIZED
目前解决办法:降低pytorch版本,PyTorch=1.7.1,python=3.7
怀疑可能是:
1.显卡驱动版本问题。
2.显卡显存被占用太多。
3.还可能是docker镜像并不能完美适应,10系类和20系类显卡打包的镜像可能有冲突,不能完美迁移。(自己推测)