目录
一)、为什么有标签平滑正则化(Label Smoothing Regularization, LSR)的方法?
转载深度学习中的标签平滑正则化(Label Smoothing Regularization)方法原理详解
1、动机
最近在看KD相关资料,看到有对KD知识蒸馏的一种解释,于是准备记录下
2、白话举例了解
一)、为什么有标签平滑正则化(Label Smoothing Regularization, LSR)的方法?
在深度学习样本训练的过程中,我们采用one-hot真实标签去进行计算交叉熵损失时,只考虑到训练样本中正确的标签位置(one-hot标签为1的位置)的损失,而忽略了错误标签位置(one