logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

【Python X3】PyTorch实现神经网络自制分类数据集的训练并将其部署在地平线旭日3开发板上的全流程

文章目录1 故事开头2 问题分析3 Mobilenetv2网络结构介绍4 服务器端训练自制分类数据集并预测5 将pth模型转换成onnx模型6 文件1下载7 旭日3开发板Ubuntu20.04系统镜像安装8 配置地平线提供的docker开发环境9 在docker环境中将onnx模型转换成上板模型10 文件2下载11 将异构模型部署在X3开发板上12 文件3下载13 所有文件下载一直没有看到介绍深度

#pytorch#python
【包路径】如何查看whl包安装的路径

在终端中输入python3,导入包,使用。即可获取包的安装路径。

#python
【X3 python部署】地平线x3开发板bin模型上板运行

文章目录将转换得到的.bin模型在x3开发板上跑起来。

#python
【迁移训练】Imagenet上的模型预训练权重用到CIFAR10上

文章目录 1 总体概述2 加载权重3 冻结特征提取层权重进行训练4 项目整体代码5 感谢链接 1 总体概述 在Imagenet上训练的预训练权重,用到CIFAR10数据集上,再代码层面有以下几个问题,模型最后一层权重个数不同,如何加载呢?要是想冻结权重进行训练又怎么办呢?下面分别进行解答。 2 加载权重 以Mobilenetv2为例,Imagenet2012分类数据集,类别个数为1000,故网络

#python#深度学习#神经网络 +1
【Roofline 推理速度】影响深度学习模型推理速度的因素及相关基础知识

文章目录1 问题分析2 计算平台角度分析2.1 算力 π2.2 带宽 β\betaβ2.2 计算强度上限 ImaxI_{max}Imax​3 模型自身的性能评价指标3.1 计算量与参数量3.2 访存量3.3 模型的计算强度III3.4 模型的理论性能PPP3.5 内存占用4 Roof-line Model4.1 用来解决什么问题4.2 Roof-line是什么4.2.1 带宽瓶颈区域 Memory

#深度学习
【YOLOv3 Train】YOLOv3训练全过程

文章目录1 网络训练流程概述2 训练前先注意3 整体代码理解4 一轮训练与验证代码5 感谢链接1 网络训练流程概述想得到一个model_best模型,宽泛的考虑:拿到数据,训练一下,谁效果好,谁就是model_best。细致考虑的话,需要注意以下要点:是否使用cuda?数据集准备和划分比例关系训练多少个epoch?是否要先冻结特征提取部分参数训练,然后再解冻训练?通常不是学习率大小和batch_s

#深度学习#python#pytorch
Ubuntu16.04 安装python3.6

文章目录1 为什么2 安装python3.63 调整python顺序1 为什么常用python3.6,但ubuntu16.04中默认安装的是 python2.7 和 python3.5.2 (注意 : 这两个版本不能删除/卸载,否则系统很容易出错)2 安装python3.6sudo add-apt-repository ppa:deadsnakes/ppa# 把ppa源整过来,添加一下sudo a

#linux#ubuntu#python
【nvidia-smi Failed】查看NVIDIA显卡上的进程

文章目录1 问题描述2 解决方案1 问题描述常规查看显卡上在运行哪些程序,只需命令:watch nvidia-smi但有一天,它报错了:Failed to initialize NVML: Driver/library version mismatch不知道是否有程序在跑?关机重启?2 解决方案可以用如下命令解决:fuser -v /dev/nvidia*PID比较多,应该是启用了多进程。有些人隐

#深度学习
【深度学习框架输入格式】NCHW还是NHWC?

文章目录1 三大框架使用格式2 NCHW和NHWC优缺点对比3 如何从输入图像到想要的格式呢?1 三大框架使用格式PyTorch:NCHWCaffe:NCHWTensorFlow:默认使用NHWC,GPU也支持NCHW2 NCHW和NHWC优缺点对比NCHW 必须等所有通道输入准备好才能得到最终输出结果,需要占用较大的临时空间。NHWC 的访存局部性更好(每三个输入像素即可得到一个输出像素);Te

#python#深度学习#pytorch +1
【Roofline 推理速度】影响深度学习模型推理速度的因素及相关基础知识

文章目录1 问题分析2 计算平台角度分析2.1 算力 π2.2 带宽 β\betaβ2.2 计算强度上限 ImaxI_{max}Imax​3 模型自身的性能评价指标3.1 计算量与参数量3.2 访存量3.3 模型的计算强度III3.4 模型的理论性能PPP3.5 内存占用4 Roof-line Model4.1 用来解决什么问题4.2 Roof-line是什么4.2.1 带宽瓶颈区域 Memory

#深度学习
    共 80 条
  • 1
  • 2
  • 3
  • 8
  • 请选择