python图像数据增强——imgaug （一）

最新推荐文章于 2025-06-24 17:21:50 发布

Liu-Kevin

最新推荐文章于 2025-06-24 17:21:50 发布

阅读量4w

点赞数 24

CC 4.0 BY-SA版权

分类专栏：机器学习文章标签：数据增强 imgaug 训练数据少图像增强图像扩增

本文链接：https://blog.csdn.net/limiyudianzi/article/details/86497305

机器学习专栏收录该内容

22 篇文章

订阅专栏

本文介绍如何使用imgaug库进行图像增强，通过旋转、加入噪声和仿射变换等方法增加数据量，解决深度学习中因图像数量有限导致的过拟合问题。详细展示了imgaug的基础用法和进阶示例，包括图像裁剪、翻转和高斯模糊等操作。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

（一）imgaug基础用法
（二）imgaug进阶示例
（三）imgaug图像分割数据增强

在机器学习或者深度学习的问题中，因为受制于图像采集的方式，投入的精力和图像标注的难度等，用于训练的图像数量可能非常有限。这种情况下，可能出现模型过拟合，训练后的模型泛化能力差等问题，降低模型的实际使用能力，这种现象在医学图像的深度学习中尤其常见。为了在有限的数据下得到更好的分类，检测和分割的结果，往往需要使用数据增强的方式，通过对图像的旋转，加入噪声，仿射变换等方式增加数据量。这里我们就介绍一个python中常见的数据增强库，imgaug

这个包可以直接使用pip进行安装，其安装方法如下

pip3 install git+https://github.com/aleju/imgaug #从github安装
pip3 install Augmentor –user #pip直接安装

该数据增强库也非常容易上手，加入我们已经读取了二维的图像数据，记为images，images应该有四个维度，分别为（N,height,weidth,channels）就是图像数量，图像高度，图像宽度，图像的通道（RGB）。如果是灰度图的话，也必须为四个维度，其中channels为1。数据必须是uint8类型，大小在0到255之间。有了这个准备我们就可以对images中的图像数据进行增强了。

from imgaug import augmenters as iaa #引入数据增强的包

seq = iaa.Sequential([         #建立一个名为seq的实例，定义增强方法，用于增强
    iaa.Crop(px=(0, 16)),     #对图像进行crop操作，随机在距离边缘的0到16像素中选择crop范围
    iaa.Fliplr(0.5),     #对百分之五十的图像进行做左右翻转
    iaa.GaussianBlur((0, 1.0))     #在模型上使用0均值1方差进行高斯模糊
])

images_aug = seq.augment_images(images)    #应用数据增强

在上面的代码中，得到的images_aug就是数据增强之后的结果了，它就可以用来训练我们的深度学习模型或者用于其他。为了更加直观的展示数据增强的结果，我们从官网上截了如下的图像，这就是一只松鼠会被数据增强为如下的样子。
在这里插入图片描述
在下一章中，我们会展示一个基本包含了所有的分类问题数据增强方法的例子，之后如果要使用这个库，就可以直接复制然后删减得到适合自己数据的增强方法。