【LSR标签平滑理解】

深度解析：标签平滑正则化（LSR）

静静喜欢大白

已于 2022-08-15 14:50:47 修改

阅读量947

点赞数

CC 4.0 BY-SA版权

分类专栏： pyg KD论文阅读文章标签： KD

于 2021-06-21 11:33:17 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/lj2048/article/details/116742664

KD论文阅读同时被 2 个专栏收录

53 篇文章 ¥49.90 ¥99.00

订阅专栏

超级会员免费看

118 篇文章

订阅专栏

标签平滑正则化（LSR）用于改善深度学习模型的泛化能力，通过平滑真实标签避免过拟合。本文从动机、实现方式、公式及应用场景等方面详细阐述LSR的原理和实践。

目录

2、白话举例了解

一)、为什么有标签平滑正则化（Label Smoothing Regularization, LSR）的方法?

二)、标签平滑是如何实现的?

三)、标签平滑的公式

四)、进行标签平滑的softmax损失的代码实现

五)、标签平滑的应用场景

转载深度学习中的标签平滑正则化（Label Smoothing Regularization）方法原理详解

1、动机

最近在看KD相关资料，看到有对KD知识蒸馏的一种解释，于是准备记录下

2、白话举例了解

一)、为什么有标签平滑正则化（Label Smoothing Regularization, LSR）的方法?

在深度学习样本训练的过程中，我们采用one-hot真实标签去进行计算交叉熵损失时，只考虑到训练样本中正确的标签位置（one-hot标签为1的位置）的损失，而忽略了错误标签位置（one

了解本专栏

超级会员免费看

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

静静喜欢大白 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。