YOLOv4 v3 SSD faster rcnn 数据集增广，数据集扩充，数据集增强的常用方法与软件

最新推荐文章于 2025-06-26 09:08:32 发布

爱吃西瓜的小松鼠

最新推荐文章于 2025-06-26 09:08:32 发布

阅读量3.6k

点赞数 4

CC 4.0 BY-SA版权

分类专栏：深度学习文章标签：深度学习神经网络机器学习数据挖掘 tensorflow

本文链接：https://blog.csdn.net/qq_40979622/article/details/105741015

深度学习专栏收录该内容

2 篇文章

订阅专栏

1、为何要增广数据集呢？ VOC 格式

因为我们平时自己用来训练的数据集需要自己制作。公共数据集无法满足自己的针对性需求。

2、增广的方法有哪些？

水平翻转增强，垂直翻转增强，镜像对称增强，仿射变化，旋转，高斯加噪，对比度变化，尺度变换，平移等增强方法，
3、数据集格式？

第一种文件或者文件夹代表标签，不需要对图像中的目标进行打标签。

第二种通过打框来进行标注：缺点是麻烦工作量大。

办法一：通过代码：

常用的几种反转：

bmp = imread(filname);
I = fliplr(bmp);

平移：

bmp = imread(filename);  %读入图片
se= translate(strel(1), [y, x]);
Img = imdilate(bmp, se);

旋转：

bmp = imread(filename);
I = imrotate(bmp, 10, 'bilinear', 'crop');

加噪声：

bmp = imread(filename);
I1 = imnoise(bmp, 'salt & pepper'); %椒盐噪声
w = [1 2 1; 2 4 2; 1 2 1];
I2 = imfilter(bmp, w, 'corr', 'replicate'); %高斯噪声
w = [1 1 1; 1 1 1; 1 1 1] / 9;
I3 = imfilter(bmp, w, 'corr', 'replicate'); %平均平滑
I4 = medfilt2(bmp, [3, 3]);  %中值滤波

等等，，，，，这里不一一举例。

还有一种就是通过软件：直接扩充数据集，标签自动生成对齐。