使用平滑拼接技术实现遥感图像语义分割预测-CSDN博客

本文链接：https://blog.csdn.net/gitblog_00625/article/details/148548642

使用平滑拼接技术实现遥感图像语义分割预测

项目背景

本项目展示了如何使用深度学习模型对遥感图像进行语义分割预测，并重点介绍了两种不同的预测方式：基础分块预测和平滑拼接预测。通过对比这两种方法，我们可以清晰地看到平滑拼接技术在消除预测边界伪影方面的优势。

技术要点解析

1. 基础分块预测方法

基础分块预测是处理大尺寸图像的常见方法，其核心步骤如下：

图像预处理：
- 将输入图像裁剪为能被分块尺寸整除的大小
- 使用patchify库将图像划分为不重叠的256x256像素块
逐块预测：
- 对每个图像块进行归一化处理（使用MinMaxScaler）
- 使用预训练的UNet模型进行预测
- 取预测结果的argmax获取类别标签
结果重组：
- 将所有预测结果重新组合成完整图像
- 使用unpatchify函数将分块预测合并

这种方法虽然简单直接，但会在块与块交界处产生明显的边界效应，影响预测结果的连续性。

2. 平滑拼接预测方法

平滑拼接预测通过重叠分块和加权平均的方式有效解决了边界伪影问题：

图像归一化：
- 对整个输入图像进行归一化处理
滑动窗口预测：
- 使用predict_img_with_smooth_windowing函数
- 设置窗口大小为256x256，子分块数为2（表示50%重叠）
- 定义预测函数（调用模型预测）
结果融合：
- 对重叠区域的预测结果进行加权平均
- 取最终概率最大的类别作为每个像素的预测结果

这种方法虽然计算量稍大，但能显著提升预测结果的平滑度和连续性。

3. 类别可视化处理

项目还包含了将预测标签转换为彩色图像的功能，便于直观比较：

def label_to_rgb(predicted_image):
    # 定义各类别的RGB颜色值
    Building = [60, 16, 152]
    Land = [132, 41, 246]
    Road = [110, 193, 228]
    Vegetation = [254, 221, 58]
    Water = [226, 169, 41]
    Unlabeled = [155, 155, 155]
    
    # 创建彩色图像
    segmented_img = np.empty((predicted_image.shape[0], predicted_image.shape[1], 3))
    # 根据类别标签填充颜色
    segmented_img[(predicted_image == 0)] = Building
    segmented_img[(predicted_image == 1)] = Land
    # ...其他类别处理
    return segmented_img.astype(np.uint8)