UNet改进（21）：门控注意力机制在UNet中的应用与优化

摸鱼许可证

于 2025-07-11 20:16:14 发布

阅读量561

点赞数 17

CC 4.0 BY-SA版权

分类专栏： UNet涨点改进；最新注意力与Transformer改进实战文章标签：人工智能图像处理计算机视觉

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/2501_91516851/article/details/149281931

UNet涨点改进；最新注意力与Transformer改进实战专栏收录该内容

37 篇文章 ¥39.90 ¥99.00

订阅专栏

超级会员免费看

1. 传统UNet架构回顾

UNet采用经典的编码器-解码器结构，包含：

编码器（下采样路径）：通过卷积和池化逐步提取高级特征
解码器（上采样路径）：通过转置卷积恢复空间分辨率
跳跃连接：连接编码器和解码器对应层，保留空间信息

传统UNet的主要局限在于：

跳跃连接简单拼接，缺乏对重要特征的筛选
对所有空间位置同等对待，无法聚焦关键区域

2. 门控注意力机制原理

门控注意力机制(Gated Attention)的核心思想是通过动态生成的注意力图来加权特征图，使模型能够：

自动学习哪些区域需要更多关注
抑制不相关或噪声区域
增强目标边界的定位能力

2.1 门控注意力数学表达

门控注意力的计算过程可表示为：

门控信号变换：$W_g(g) = Conv_{1×1}(g)$
特征变换：$W_x(x) = Conv_{1×1}(x)$
注意力图生成：

了解本专栏

超级会员免费看

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

摸鱼许可证 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。