DeepLabV3+模型在水体分割中的性能分析
立即解锁
发布时间: 2025-08-31 00:13:58 阅读量: 3 订阅数: 11 AIGC 

### DeepLabV3+模型在水体分割中的性能分析
#### 1. 研究背景与动机
在多光谱图像分割中,多尺度特征提取至关重要。传统方法多采用普通卷积,难以捕捉多尺度信息。而空洞卷积能以不同速率捕捉多尺度信息,DeepLabv3+便是利用空洞卷积的模型,具有编码器 - 解码器架构。水体分割是一项具有挑战性的任务,受水体形状、颜色、云层存在、背景反射等多种因素影响。因此,分析使用先进编码器架构的DeepLabV3+模型在水体分割中的性能具有重要意义。
#### 2. 数据集相关情况
- **数据集收集**:本研究使用的数据集来自Kaggle,由Francisco Escobar发布,名为“Satellite image of water bodies”。该数据集包含2841张RGB图像及对应的掩码,图像由Sentinel - 2卫星捕获,像素大小从69 × 5到6683 × 5640不等,可作为一个247 MB的压缩文件下载。
- **数据集预处理**:
1. **去除无数据区域**:数据集中多数图像存在“无数据区域”,这些区域与背景类不同,不包含重要信息。使用VGG Annotator去除输入图像和对应掩码中的无数据区域。
2. **去除图像 - 掩码不匹配的对**:手动检查所有图像 - 掩码对,移除不匹配的对。
3. **去除小尺寸图像和掩码**:移除尺寸小于100 * 100的图像和掩码。
4. **创建子样本**:创建100 * 100的补丁,共获取9878个子样本用于研究。
#### 3. 研究方法
- **数据划分**:将9878个子样本按9:1的比例划分为训练集和测试集,即988张图像用于测试,8890张用于训练。训练集再按8:2的比例划分为训练集和验证集,1778张用于验证,7112张用于训练。
- **模型架构**:以DeepLabv3+为基础架构,其编码器层从输入图像中提取纹理信息并降低空间维度,解码器部分通过上采样恢复空间维度。除了DeepLabv3+现有的Xception编码器架构,还使用了ResNet - 50和U - Net作为编码器。
- **ResNet - 50**:以其跳跃连接解决梯度消失问题。
- **U - Net**:具有扩展路径和收缩路径,可使用较少的图像进行训练。
- **模型训练**:
- **训练参数**:三个模型(Xception、ResNet - 50和U - Net)均训练50个epoch,批量大小为4,学习率设置为0.001,损失函数为二元交叉熵,使用Adam优化器调整权重和偏差。由于输入图像较小,空洞卷积率(r)分别赋值为1、2和3。
- **训练资源**:在HPC上进行训练,ncpus = 25,内存 = 100 gb,训练推理时间为3到4小时。
下面是训练流程的mermaid流程图:
```mermaid
graph LR
A[数据集预处理] --> B[数据划分]
B --> C[模型训练]
C --> D[模型评估]
```
#### 4. 结果分析
- **训练和验证损失**:
- **Xception模型**:前五个epoch训练损失约为0.2,在第30个epoch左右
0
0
复制全文
相关推荐










