`torch.no_grad()`的实际含义：后续运算不记录梯度信息

最新推荐文章于 2025-05-17 20:22:53 发布

ZhangJiQun&MXP

最新推荐文章于 2025-05-17 20:22:53 发布

阅读量121

点赞数 1

CC 4.0 BY-SA版权

分类专栏：教学 2024大模型以及算力 2021 AI python 文章标签：人工智能开发语言 android langchain 网络

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_38998213/article/details/147950111

教学同时被 3 个专栏收录

1886 篇文章 ¥199.90 ¥299.90

订阅专栏

1474 篇文章 ¥199.90 ¥299.90

订阅专栏

2024大模型以及算力

1285 篇文章 ¥199.90 ¥299.90

订阅专栏

`torch.no_grad()`的实际含义：后续运算不记录梯度信息

torch.no_grad() 是PyTorch中的一个上下文管理器，作用是禁用梯度计算 。

原理

在PyTorch中，自动求导机制（autograd）通过构建计算图来记录张量的运算过程，以便反向传播时计算梯度。torch.no_grad() 进入其管理的代码块后，会自动将所有计算得出的张量的 requires_grad 属性设为 False** ，阻止计算图的构建，即后续运算~~不记录~~ 梯度信息**。

应用场景

模型推理阶段：模型训练好后进行推理（预测）时，只需前向传播得到输出结果，无需反向传播计算梯度更新参数。如使用训练好的图像分类模型对新图片分类，用 torch.no_grad() 包裹推理代码，可避免计算和存储不必要的梯度，减少内存占用、加快推理速度。像对大量图片批量预测场景，能显著提升效率。
模型评估阶段：在评估模型性能（如计算验证集或测试集的准确率、损失等指标）时，不涉及参数更新，不需要梯度。例如计算语言模型在测试集上的困惑度，使用 torc

了解本专栏

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

ZhangJiQun&MXP 等到80岁回首依旧年轻

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。