Softmax损失函数

最新推荐文章于 2025-07-09 23:23:50 发布

lanmengyiyu

最新推荐文章于 2025-07-09 23:23:50 发布

阅读量3.1k

点赞数

CC 4.0 BY-SA版权

分类专栏：深度学习相关（cs231n）文章标签： softmax 损失函数 svm

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/lanmengyiyu/article/details/78827491

深度学习相关（cs231n）专栏收录该内容

49 篇文章

订阅专栏

本文探讨了softmax损失函数的数学表达式及其与SVM损失函数的差异。softmax损失函数能够量化预测值与实际值间的偏差，并且对所有类别间距的变化都敏感。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

上一篇博客讨论了SVM的损失函数，本篇博客主要来讨论softmax的损失函数以及两者之间的差别。

首先，softmax损失函数用数学公式可以表示为如下：
$L_i=-\log(\frac{e^{f_{y_i}}}{\sum_{j}e^{f_j}})$
其中， $f_{y_i}$ 表示经过线性矩阵后真实分类的值， $\sum_{j}e^{f_j}$ 表示某个样本所有分类值的和。

接下来，讨论3个问题：

1.当最初w趋近于0的时候，Loss为多少？
为类别数的倒数再取对数。可以以此来校验loss function是否书写正确

2.Loss的取值范围？
同SVM的loss一样， $[0, +\infty]$

3.与SVM的loss function 有什么不同？
SVM的loss function 计算中，当损失类间距大于 $\Delta$ 时，无论差别多大都没有影响了，也就是说，只有在分类边界附近的数据扰动才会有影响，才会对权重w有作用。
softmax中，无论类别间距差别多大，扰动都会对损失值有影响，只不过是影响大或者小的区别。

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。