15、矩阵微积分导数与神经网络中的数据流

最新推荐文章于 2025-08-31 15:28:14 发布

yhn456789

最新推荐文章于 2025-08-31 15:28:14 发布

阅读量7

点赞数

CC 4.0 BY-SA版权

分类专栏：深度学习的数学基石文章标签：矩阵微积分神经网络数据流

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/yhn456789/article/details/151042058

深度学习的数学基石专栏收录该内容

21 篇文章 ¥399.00 ¥499.90

订阅专栏

超级会员免费看

矩阵微积分导数与神经网络中的数据流

1. 矩阵微积分导数示例

在深度学习中，我们经常会遇到各种导数计算，下面通过一些具体例子来进行说明。

1.1 逐元素运算的导数

逐元素运算包括向量相加等操作。考虑两个向量逐元素相加的情况，设(f = a + b)，那么(\frac{\partial f}{\partial a})（即(f)的雅可比矩阵）是什么样的呢？根据定义，由于(f_0)只依赖于(a_0)，(f_1)只依赖于(a_1)，以此类推，所以当(i \neq j)时，所有的导数(\frac{\partial f_i}{\partial a_j})都为零。这就消除了矩阵的所有非对角元素，只剩下对角元素，因为对于所有的(i)，(\frac{\partial f_i}{\partial a_i} = 1)，所以(\frac{\partial f}{\partial a} = I)。同理，(\frac{\partial f}{\partial b} = I)。如果将加法改为减法，即(f = a - b)，则(\frac{\partial f}{\partial a} = I)，而(\frac{\partial f}{\partial b} = -I)。

若操作是(a)和(b)的逐元素乘法，即(f = a \otimes b)，则会得到特定的结果，这里(\text{diag}(x))表示将向量(x)的(n)个元素放在一个(n \times n)矩阵的对角线上，其余位置为零。

1.2 激活函数的导数

在前馈网络的隐藏层中，对于单个节点，我们需要求出其权重和偏置值的导数。节点的输入是前一层的输出(x)与权重(w)逐元素相乘，再加上

了解本专栏

超级会员免费看

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。