ACNet——涨点且不增加耗时的技巧_神经网络涨点方法-CSDN博客

本文链接：https://blog.csdn.net/u014380165/article/details/103916114

ACNet是一种无额外计算量的非对称卷积网络，通过在训练阶段强化特征提取，推理阶段融合卷积核，提升了模型效果，特别是在图像翻转和旋转的鲁棒性方面表现出色。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

论文：ACNet: Strengthening the Kernel Skeletons for Powerful CNN via Asymmetric
Convolution Blocks
论文链接：https://arxiv.org/abs/1908.03930
代码链接：https://github.com/DingXiaoH/ACNet

图像分类领域，从VGG到DenseNet那几年是比较活跃的，最近两年这个领域的论文越来越少见了，要做出有影响力的工作也越来越难。而这两年这个领域的主要方向集中在：1、网络结构搜索，比如EfficientNet算目前效果比较好的代表作。2、更好的特征表达，这部分跟第一部分并不是完全独立的，主要是把特征复用、特征细化做得更加极致，代表作有HRNet、Res2Net等。

当然，以上这些不是这篇博客要讲的内容，这篇博客要介绍的是ICCV2019上的一篇论文：ACNet，全称是Asymmetric Convolution Net，翻译过来就是非对称卷积网络。这篇论文也是从更好的特征表达角度切入实现效果提升，不过更重要的是：没有带来额外的超参数，而且在推理（或者叫验证、部署，本质上都是只执行前向计算）阶段没有增加计算量，在我看来后者更有吸引力。

在开始介绍ACNet之前，先来看一个关于卷积计算的式子，式子中I表示一个二维矩阵，可以看做是卷积层的输入，也就是输入特征图，K(1)和K(2)分别表示2个二维卷积核，这2个卷积核的宽和高是一样的，那么下面这个式子的意思就是：先进行K(1)和I卷积，K(2)和I卷积后再对结果进行相加，与先进行K(1)和K(2)的逐点相加后再和I进行卷积得到的结果是一致的。这是ACNet能够在推理阶段不增加任何计算量的原因。
在这里插入图片描述