Tensorflow实现MNIST手写数字识别

最新推荐文章于 2024-08-17 20:26:25 发布

磐创 AI

最新推荐文章于 2024-08-17 20:26:25 发布

阅读量2k

点赞数 1

CC 4.0 BY-SA版权

分类专栏：机器学习 TensorFlow

本文链接：https://blog.csdn.net/fendouaini/article/details/80245515

本文通过Tensorflow详细介绍了MNIST手写数字识别的实现过程，包括数据集介绍、网络结构设计，以及训练过程。文章讨论了如何加载MNIST数据集，构建包含隐藏层的神经网络，使用梯度下降法进行优化，并展示了如何通过改变损失函数、优化算法以及应用dropout技术来提高模型准确率。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

之前我们讲了神经网络的起源、单层神经网络、多层神经网络的搭建过程、搭建时要注意到的具体问题、以及解决这些问题的具体方法。本文将通过一个经典的案例：MNIST手写数字识别，以代码的形式来为大家梳理一遍神经网络的整个过程。

一、MNIST手写数字数据集介绍

MNIST手写数字数据集来源于是美国国家标准与技术研究所，是著名的公开数据集之一，通常这个数据集都会被作为深度学习的入门案例。数据集中的数字图片是由250个不同职业的人纯手写绘制，数据集获取的网址为：http://yann.lecun.com/exdb/mnist/。（下载后需解压）

具体来看，MNIST手写数字数据集包含有60000张图片作为训练集数据，10000张图片作为测试集数据，且每一个训练元素都是28*28像素的手写数字图片，每一张图片代表的是从0到9中的每个数字。该数据集样例如下图所示：

如果我们把每一张图片中的像素转换为向量，则得到长度为28*28=784的向量。因此我们可以把MNIST数据训练集看作是一个[60000,784]的张量，第一个维度表示图片的索引，第二个维度表示每张图片中的像素点。而图片里的每个像素点的值介于0-1之间。

此外，MNIST数据集的类标是介于0-9的数字，共10个类别。通常我们要用独热编码（One_Hot Encoding）的形式表示这些类标。所谓的独热编码，直观的讲就是用N个维度来对N个类别进行编码，并且对于每个类别，只有一个维度有效，记作数字1 ；其它维度均记作数字0。例如类标1表示为：([0,1,0,0,0,0,0,0,0,0])；同理标签2表示为：([0,0,1,0,0,0,0,0,0,0])。最后我们通过softmax函数输出的是每张图片属于10个类别的概率。

二、网络结构的设计

接下里通过Tensorflow代码，实现MINIST手写数字识别的过程。首先，如程序1所示，我们导入程序所需要的库函数、数据集：

import tensorflow as tf
from tensorflow.examples.tutorials.mnist import input_data

接下来，我们读取MNIST数据集，并指定用one_hot的编码方式；然后定义batch_size、batch_num两个变量，分别代表一次性传入神经网络进行训练的批次大小，以及计算出训练的次数。如程序2所示：

程序2：

mnist_data=input_data.read_data_sets("MNIST.data",one_hot=True)
batch_size=100
batch_num=mnist_data.train.num_examples//batch_size

我们需要注意的是：在执行第一句命令时，就会从默认的地方下载MNIST数据集，下载下来的

最低0.47元/天解锁文章

新学期VIP享超值加赠

Tensorflow实现MNIST手写数字识别

一 、MNIST手写数字数据集介绍

二 、网络结构的设计

一、MNIST手写数字数据集介绍

二、网络结构的设计