Keras中 .fit和.fit_generator函数

最新推荐文章于 2024-05-16 14:30:38 发布

我是天才很好

最新推荐文章于 2024-05-16 14:30:38 发布

阅读量1.4k

点赞数 4

CC 4.0 BY-SA版权

分类专栏： keras

原文链接：https://blog.csdn.net/weixin_38145317/article/details/88709727?biz_id=102&utm_term=keras%20fit_generator&utm_medium=distribute.pc_search_result.none-task-blog-2~all~sobaiduweb~default-0-88709727&spm=1018.2118.3001.4187

keras 专栏收录该内容

8 篇文章

订阅专栏

本文深入探讨了Keras库中的三种训练模型方法：.fit，.fit_generator和.train_on_batch，详细解释了它们的工作原理及应用场景，特别是针对大规模数据集和需要数据增强情况下的.fit_generator函数的使用。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

在本教程中，您将了解Keras .fit和.fit_generator函数的工作原理，包括它们之间的差异。
为了帮助您获得实践经验，我已经提供了一个完整的示例，向您展示如何从头开始实现Keras数据生成器。

Keras深度学习库包括三个独立的函数，可用于训练您自己的模型：

.fit
.fit_generator
.train_on_batch

这三个函数基本上可以完成相同的任务，但他们如何去做这件事是非常不同的。
让我们逐个探索这些函数，查看函数调用的示例，然后讨论它们彼此之间的差异。

调用.fit：

model.fit(trainX, trainY, batch_size=32, epochs=50)

在这里可以看到提供的训练数据（trainX）和训练标签（trainY）。然后，我们指示Keras允许我们的模型训练50个epoch，同时batch size为32。

对.fit的调用在这里做出两个主要假设：

我们的整个训练集可以放入RAM
没有数据增强（即不需要Keras生成器）

我们的网络将在原始数据上训练。原始数据本身适合内存，我们无需将旧批量数据从RAM中移出并将新批量数据移入RAM。此外，我们不会使用数据增强动态操纵训练数据。

对于小型，简单化的数据集，使用Keras的.fit函数是完全可以接受的。

这些数据集通常不是很具有挑战性，不需要任何数据增强。

但是，真实世界的数据集很少这么简单：

真实世界的数据集通常太大而无法放入内存中
它们也往往具有挑战性，要求我们执行数据增强以避免过拟合并增加我们的模型的泛化能力

调用.fit_generator：

在以上那些情况下，我们需要利用Keras的.fit_generator函数，函数原型为，

fit_generator(self, generator,            
                    steps_per_epoch=None, 
                    epochs=1, 
                    verbose=1, 
                    callbacks=None, 
                    validation_data=None, 
                    validation_steps=None,  
                    class_weight=None,
                    max_queue_size=10,   
                    workers=1, 
                    use_multiprocessing=False, 
                    shuffle=True, 
                    initial_epoch=0)

优点：通过Python generator产生一批批的数据用于训练模型。generator可以和模型并行运行，例如，可以使用CPU生成批数据同时在GPU上训练模型。

参数：

generator：一个generator或Sequence实例，为了避免在使用multiprocessing时直接复制数据。
steps_per_epoch：从generator产生的步骤的总数（样本批次总数）。通常情况下，应该等于数据集的样本数量除以批量的大小。
epochs：整数，在数据集上迭代的总数。
works：在使用基于进程的线程时，最多需要启动的进程数量。
use_multiprocessing：布尔值。当为True时，使用基于过程的线程。

# initialize the number of epochs and batch size
EPOCHS = 100
BS = 32
 
# construct the training image generator for data augmentation
aug = ImageDataGenerator(rotation_range=20, zoom_range=0.15,
	width_shift_range=0.2, height_shift_range=0.2, shear_range=0.15,
	horizontal_flip=True, fill_mode="nearest")
 
# train the network
H = model.fit_generator(aug.flow(trainX, trainY, batch_size=BS),
	validation_data=(testX, testY), steps_per_epoch=len(trainX) // BS,
	epochs=EPOCHS)