ECCV 2022 | 通过重新审视全局信息聚合提高图像恢复质量

旷视

于 2022-10-19 14:10:33 发布

阅读量1.2k

点赞数 1

CC 4.0 BY-SA版权

文章标签： python 计算机视觉机器学习人工智能深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Megvii_tech/article/details/127419008

本文探讨了深度学习在图像恢复任务中的全局信息聚合问题，指出训练与测试阶段的不一致性影响模型性能。通过提出测试时局部转换器(TLC)，在不增加大量计算开销的情况下，显著提高了图像恢复模型的性能，减少了不一致性导致的负面影响。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

论文链接：https://arxiv.org/abs/2112.04491

图像恢复任务，是指将受损（如带噪声/模糊）的图像恢复为清晰图像。这在日常生活中广泛出现，如手机拍摄的照片通常需要经过图像恢复算法对其进行去噪/去模糊等一系列处理之后，再显示给用户。

随着人工智能的崛起，深度学习也占领了图像恢复领域的高地：近年的模型如HINet[1], MPRNet[2], Restormer[3] 等等均在该领域取得了领先的性能。

本文首先介绍基于深度学习的图像恢复任务的流程背景，然后重新审视模型中常见的全局信息聚合操作并揭示现有方法中被大家广泛忽视的问题：训练和测试的不一致性。最后，我们会介绍一个简单的解决方法——测试时局部转换器（Test-time Local Converter, 简称TLC），通过缓解不一致性问题来提升模型性能。

背景：图像恢复任务流程

图1. 图像恢复任务训练/测试过程示意图

在实际应用中，用于图像恢复任务(如去模糊)的数据集通常由高分辨率图像组成。由于数据增广的需要和GPU显存的限制，通常的做法是用从高分辨率图像中裁剪的小块来训练模型。以GoPro数据集为例，MPRNet[2]在训练时使用从原图中裁剪出的256x256的小块（如图1. 上半部分所示），而在推理(inference)过程中，为了利用全图信息，训练好的模型会直接复原720x1280的高分辨率图像（如图1. 下半部分所示）。

所以，模型的输入在训练/推理的过程中存在

最低0.47元/天解锁文章

200万优质内容无限畅学

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。