使用变分编解码器实现自动图像生成_向量转为图像网络-CSDN博客

本文链接：https://blog.csdn.net/tyler_download/article/details/87525205

深度学习不仅仅在擅长于从现有数据中发现规律，而且它能主动运用规律创造出现实世界没有的实例来。例如给网络输入大量的人脸图片，让它识别人脸特征，然后我们可以指导网络创建出现实世界中不存在的人脸图像，把深度学习应用在创造性生成上是当前AI领域非常热门的应用。

从本节开始，我们将接触神经网络在图像生成方面的应用。有两种专门构建的网络在图像生成上能实现良好效果，一种网络叫变分编解码器，另一种叫生成型对抗性网络。这两种网络不仅仅能有与图片生成，还能用于音乐，声音，以及文本生成，但是在图像生成的效果上表现最好，因此接下来我们看看如何构建相应网络实现生成功能。

图像生成的关键思想是，使用网络构造一个向量空间，空间中每一个向量都可以映射成一张真实图片。在网络中有一个模块，读入该向量后，能够经过一系列运算把向量转换成一张图片所对应的二维向量，这个模块在编解码器网络里称为解码器。

编解码器网络的运行流畅如下：

屏幕快照 2019-02-15 下午5.44.51.png

首先我们把大量图片输入到网络中，网络识别图片并抽取图片中蕴含的规律，它把这些规律进行编码，以向量的形式存储，向量的长度越大，它就能存储越多的图片信息。接着网络的解码器模块解读编码向量，由于向量存储的是所有图片共同展现的人脸特征，而不是某个具体人的人脸特征，因此解码器解读编码向量后，就能根据向量蕴含的人脸特征进行绘图，最终构造出原来训练图片里没有的人脸图案，但这个人脸图案的特征与训练图片里面的人脸特征有相关性。

其实我们在前面章节已经接触过特征向量。在前面讲解单词向量时，所谓的单词向量就是一种特征向量。向量空间中，某个方向，也就是向量里面的某些分量可能记录了训练数据的某一方面的特征，对应人脸图片来说，向量可能有一部分分量用来记录笑容特征，某些分量可能记录了眼睛特征，某些分量可能记录了头发特征，所有这些特征综合起来就可能形成一张人脸。由于解码器能够识别向量中不同分量代表的信息