Pytorch入门实战第一周：实现mnist手写数字识别

weixin_46620278

已于 2024-03-12 11:00:26 修改

阅读量1.4k

点赞数 20

CC 4.0 BY-SA版权

文章标签：深度学习人工智能

于 2024-03-12 10:53:35 首次发布

本文链接：https://blog.csdn.net/weixin_46620278/article/details/136625877

本文基于Pytorch框架，介绍了搭建并训练简单CNN网络的全过程。包括前期准备，如设置GPU、导入MNIST数据集并可视化；构建CNN网络，介绍卷积层、池化层等知识及代码实现；训练模型，设置超参数、编写训练和测试函数；最后进行结果可视化，提升了对相关概念的理解。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

前言

一、前期准备

1.1 设置GPU

1.2 导入数据

1.2.1 torchvision.datasets.MNIST介绍

1.2.2 torch.utils.data.DataLoader

1.3 数据可视化

二、构建简单的CNN网络

2.1 预备知识

2.1.1 卷积层

2.1.2 池化层

2.1.3 CNN网络结构介绍

2.2 网络结构图

2.3 CNN网络的代码实现

2.4 加载并打印模型

三、训练模型

3.1 设置超参数

3.2 编写训练函数

3.2.1 训练的几个关键函数

3.2.2 代码示例

3.3 编写测试函数

3.4 正式训练

3.4.1 基本概念介绍

3.4.2 模型训练代码

四、结果可视化

总结

前言

🍨本文为[🔗365天深度学习训练营](https://mp.weixin.qq.com/s/0dvHCaOoFnW8SCp3JpzKxg) 中的学习记录博客

🍖 原作者：K同学啊

基本配置：

语言：python3、Pytorch框架
编辑器：pycharm2020
深度学习环境：torch1.12.1+cu113

一、前期准备

1.1 设置GPU

代码：

import torch
import torch.nn as nn
import matplotlib.pyplot as plt
import torchvision
import numpy as np
import torch.nn.functional as F


'''
一、前期准备
设置cpu or GPU
导入数据
数据可视化
'''
# 设置硬件设备，如果有GPU则使用，没有则使用cpu
device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
print(device)

这里遇到一个问题，由于我自己的电脑显卡型号是Intel(R) UHD Graphics 620，而CUDA是面向Nvidia的GPU的，所以，如果要搭建CUDA环境必须要有nvidia显卡。所以这里虽然我配置的环境是cuda版本的pytorch，但是上面这个代码运行的结果为cpu，不过最后也没有影响我把结果跑出来。

1.2 导入数据

使用dataset下载MNIST数据集，并划分好训练集和测试集，并使用dataloader加载数据，并设置好基本的batch_size

1.2.1 torchvision.datasets.MNIST介绍

torchvision.datasets是Pytorch自带的数据库，用户可以通过代码在线下载数据，这里使用的是torchvision.datasets中的MNIST数据集

函数原型：torchvision.datasets.MNIST(root, train=True, transform=None,target_transform=None, download=False)

参数说明：

root (string) ：数据地址
train (string) ：True-训练集，False-测试集
download (bool,optional) : 如果为True，从互联网上下载数据集，并把数据集放在root目录下。
transform (callable, optional )：这里的参数选择一个你想要的数据转化函数，直接完成数据转化
target_transform (callable,optional) ：接受目标并对其进行转换的函数/转换。

#从pytorch自带的数据库torchvision.datasets中在线下载MNIST数据集。
train_ds = torchvision.datasets.MNIST('data',train=True,
                                      transform=torchvision.transforms.ToTensor(), # 将数据类型转化为Tensor
                                      download=True)
test_ds  = torchvision.datasets.MNIST('data',train=False,
                                      transform=torchvision.transforms.ToTensor(), # 将数据类型转化为Tensor
                                      download=True)

1.2.2 torch.utils.data.DataLoader

torch.utils.data.DataLoader是Pytorch自带的一个数据加载器，结合了数据集和取样器，并且可以提供多个线程处理数据集

函数原型：torch.utils.data.DataLoader(dataset, batch_size=1, shuffle=None, sampler=None, batch_sampler=None, num_workers=0, collate_fn=None, pin_memory=False, drop_last=False, timeout=0, worker_init_fn=None, multiprocessing_context=None, generator=None, *, prefetch_factor=2, persistent_workers=False, pin_memory_device='')

参数说明：

dataset (string) ：加载的数据集
batch_size (int,optional) ：每批加载的样本大小（默认值：1）
shuffle (bool,optional) : 如果为True，每个epoch重新排列数据。
sampler (Sampler or iterable, optional) ：定义从数据集中抽取样本的策略。可以是任何实现了 __len__ 的 Iterable。如果指定，则不得指定 shuffle 。
batch_sampler (Sampler or iterable, optional) ：类似于sampler，但一次返回一批索引。与 batch_size、shuffle、sampler 和 drop_last 互斥。
num_workers (int,optional) ：用于数据加载的子进程数。 0 表示数据将在主进程中加载（默认值：0）。
pin_memory (bool,optional) : 如果为 True，数据加载器将在返回之前将张量复制到设备/CUDA 固定内存中。如果数据元素是自定义类型，或者collate_fn返回一个自定义类型的批次。
drop_last (bool,optional) : 如果数据集大小不能被批次大小整除，则设置为 True 以删除最后一个不完整的批次。如果 False 并且数据集的大小不能被批大小整除，则最后一批将保留。（默认值：False）
timeout (numeric,optional) : 设置数据读取的超时时间，超过这个时间还没读取到数据的话就会报错。（默认值：0）