BN层和卷积层的融合

### 实现批归一化 (BN) 层与卷积层的融合 #### 背景介绍在深度学习模型中，批量归一化（Batch Normalization, BN）层通常位于卷积层之后。尽管 BN 层有助于加速网络收敛并防止过拟合，但在推理阶段会增加额外的计算开销和资源占用。通过将 BN 层参数合并到卷积层权重中，可以在不影响精度的情况下显著提高推理速度。 #### 参数转换公式假设有一个标准的二维卷积操作 \( y = W * x \)，其中 \( W \) 是卷积核矩阵，\( x \) 表示输入特征图，而 \( y \) 则表示输出特征图。当引入 BN 层时，其变换可描述如下： \[ z = \gamma\left(\frac{y-\mu}{\sqrt{\sigma^{2}+\epsilon}}\right)+\beta \] 这里的 \( \mu,\sigma^2 \) 分别代表均值和方差统计量；\( \gamma,\beta \) 为缩放和平移因子；\( \epsilon \) 用于数值稳定性[^1]。为了消除独立存在的 BN 层，在测试模式下可以直接修改原始卷积滤波器 \( W'=\gamma/\sqrt{\sigma^{2}+\epsilon}\cdot W \)，偏置项更新规则为: \[ b'=b*\gamma / (\sqrt{\sigma ^ {2} + \epsilon}) + \beta - \mu *\gamma/(\sqrt {\sigma ^ {2} + \epsilon }) \] 这样就实现了两者的无缝衔接[^2]。 #### Python代码实现下面是一个简单的 PyTorch 版本的例子展示如何执行这种融合： ```python import torch.nn as nn def fuse_conv_and_bn(conv: nn.Conv2d, bn: nn.BatchNorm2d): """ 将给定的 Conv 和 BatchNorm 层融合在一起. Args: conv (nn.Conv2d): 输入的卷积层对象 bn (nn.BatchNorm2d): 对应的批处理规范化层 Returns: fused_conv (nn.Conv2d): 已经融合后的新的卷积层实例 """ # 获取必要的属性 w_conv = conv.weight.clone().detach() mean = bn.running_mean var_sqrt = torch.sqrt(bn.running_var + bn.eps) gamma = bn.weight beta = bn.bias if isinstance(gamma, float): gamma = torch.tensor([gamma]) if isinstance(beta, float): beta = torch.tensor([beta]) # 更新权重量子 w_fused = w_conv * (gamma.view(-1, 1, 1, 1)/var_sqrt).view(-1, 1, 1, 1) # 如果存在bias，则也需要调整它 if hasattr(conv,'bias') and not conv.bias is None : bias_conv = conv.bias.data.clone().detach() new_bias = ((bias_conv-mean)*gamma/var_sqrt)+beta else: new_bias = (-mean*gamma/var_sqrt)+beta # 创建一个新的Conv2D模块作为返回结果 fused_conv = nn.Conv2d( in_channels=conv.in_channels, out_channels=conv.out_channels, kernel_size=conv.kernel_size, stride=conv.stride, padding=conv.padding, dilation=conv.dilation, groups=conv.groups, bias=True ) with torch.no_grad(): fused_conv.weight.copy_(w_fused) fused_conv.bias.copy_(new_bias) return fused_conv ``` 此函数接收两个参数——`conv` 和 `bn` ——分别对应要被融合的一对卷积层和批标准化层，并返回一个已融合的新卷积层实例[^3]。

阅读全文

BN层和卷积层的融合

相关推荐

实现对YOLOX的剪枝操作，添加了卷积层和BN层融合推理，添加中间层可视化功能，可实现预测和训练日志保存.zip

合并BN层的python脚本

caffe加速:合并BatchNorm层和Scale层到Convolution层

在融合后，需要手动删除BatchNorm2d层，并用融合后的卷积层替换原来的卷积层（和BN层）。注意：融合操作只适用于推理模式，在训练过程中，BN层不能融合。如何进行区分调用

TRT部署融合con3*3+con1*1+BN为一个卷积层

合并bn层和生成特征图的python脚本.rar

将senet模块加在池化层之后，通过卷积层与反卷积进行特征融合，再将融合得到的特征传递给剩下的卷积层进行再次学习代码

bn层融合 fuse_moudule

卷积模块和卷积层有什么区别

YOLO 卷积层

yolov8卷积层

在论文中采用的backbone是ResNet，50或者101，是融合空洞卷积核并删除了池化层的ResNet。之后分两路都先进过一个卷积层，然后分别送到位置注意力模块和通道注意力模块中去。

稀疏卷积层和用于特征提取的残差块

yolov8有多少个卷积层

生成yolov8卷积层示意图

pytorch的conv和bn融合

mobilenet主干网络bn层

G1垃圾回收器学习笔记

pdfbox-2.0.31.jar中文-英文对照文档.zip

大家在看

半导体Semi ALD Tungsten W and TiN for Advanced Contact Application

oracle 官方下载包 客户端 安全无插件无修改

FLUENT学习udf编程实例.pdf

开心小闹钟 V2.8 Beta 3 注册版

瑞星卡卡kaka小狮子（不含杀软） For Mac，情怀小程序，有动画有声，亲测可用

最新推荐

【微信小程序源码】图片预览带后端.zip

Docker化部署TS3AudioBot教程与实践

零售销售数据的探索性分析与DeepAR模型预测

llm agent平台

Docker实现OAuth2代理：安全的HTTPS解决方案

利用AmazonSageMaker进行图像分类：从理论到实践

wed前端开发网页设计

eosforce下的scatter API应用实例教程

AI模型评估与应用拓展

elasticsearch serverless

TRT部署融合con33+con11+BN为一个卷积层

oracle 官方下载包客户端安全无插件无修改