1、概念:
Dataset:一种数据结构,存储数据及其标签
Dataloader:一种工具,可以将Dataset里的数据分批、打乱、批量加载并进行迭代等
(方便模型训练和验证)
Dataset就像一个大书架,存放着带有标签的数据书籍,并且这些书有编号(0,1,2...);
而Dataloader就像一个图书管理员,负责从书架上按需取出书籍并分批提供给读者。
2、Dataset的组织形式
train:训练集 val:验证集
一种方式是label作为数据文件夹的名字,
另一种方式是label和数据本身分开成两个文件夹(label文件夹里装的是和每个数据对应的.txt)
3、处理图像:PIL(Python Imaging Library).Image
pip install Pillow | 安装PIL |
from PIL import Image | 引入Image类(代表图像对象, |