DeepLabV3+模型在水体分割中的性能分析

### DeepLabV3+模型在水体分割中的性能分析 #### 1. 研究背景与动机在多光谱图像分割中，多尺度特征提取至关重要。传统方法多采用普通卷积，难以捕捉多尺度信息。而空洞卷积能以不同速率捕捉多尺度信息，DeepLabv3+便是利用空洞卷积的模型，具有编码器 - 解码器架构。水体分割是一项具有挑战性的任务，受水体形状、颜色、云层存在、背景反射等多种因素影响。因此，分析使用先进编码器架构的DeepLabV3+模型在水体分割中的性能具有重要意义。 #### 2. 数据集相关情况 - **数据集收集**：本研究使用的数据集来自Kaggle，由Francisco Escobar发布，名为“Satellite image of water bodies”。该数据集包含2841张RGB图像及对应的掩码，图像由Sentinel - 2卫星捕获，像素大小从69 × 5到6683 × 5640不等，可作为一个247 MB的压缩文件下载。 - **数据集预处理**： 1. **去除无数据区域**：数据集中多数图像存在“无数据区域”，这些区域与背景类不同，不包含重要信息。使用VGG Annotator去除输入图像和对应掩码中的无数据区域。 2. **去除图像 - 掩码不匹配的对**：手动检查所有图像 - 掩码对，移除不匹配的对。 3. **去除小尺寸图像和掩码**：移除尺寸小于100 * 100的图像和掩码。 4. **创建子样本**：创建100 * 100的补丁，共获取9878个子样本用于研究。 #### 3. 研究方法 - **数据划分**：将9878个子样本按9:1的比例划分为训练集和测试集，即988张图像用于测试，8890张用于训练。训练集再按8:2的比例划分为训练集和验证集，1778张用于验证，7112张用于训练。 - **模型架构**：以DeepLabv3+为基础架构，其编码器层从输入图像中提取纹理信息并降低空间维度，解码器部分通过上采样恢复空间维度。除了DeepLabv3+现有的Xception编码器架构，还使用了ResNet - 50和U - Net作为编码器。 - **ResNet - 50**：以其跳跃连接解决梯度消失问题。 - **U - Net**：具有扩展路径和收缩路径，可使用较少的图像进行训练。 - **模型训练**： - **训练参数**：三个模型（Xception、ResNet - 50和U - Net）均训练50个epoch，批量大小为4，学习率设置为0.001，损失函数为二元交叉熵，使用Adam优化器调整权重和偏差。由于输入图像较小，空洞卷积率（r）分别赋值为1、2和3。 - **训练资源**：在HPC上进行训练，ncpus = 25，内存 = 100 gb，训练推理时间为3到4小时。下面是训练流程的mermaid流程图： ```mermaid graph LR A[数据集预处理] --> B[数据划分] B --> C[模型训练] C --> D[模型评估] ``` #### 4. 结果分析 - **训练和验证损失**： - **Xception模型**：前五个epoch训练损失约为0.2，在第30个epoch左右

最低0.47元/天解锁专栏

赠100次下载

继续阅读点击查看下一篇

400次会员资源下载次数

300万+ 优质博客文章

1000万+ 优质下载资源

1000万+ 优质文库回答

复制全文

DeepLabV3+模型在水体分割中的性能分析

相关推荐

专栏目录

DeepLabV3+模型在水体分割中的性能分析

相关推荐

使用 DeepLabV3+和 Google Earth Engine 进行卫星土地覆盖分割

基于开源模型DeepLabV3+的模式识别与机器学习课程的小组结课项目（课程设计）

水体分割检测-YOLOV11标记 857张图片

Keras实现DeeplabV3+在遥感图像分割中的应用

利用DeepLabV3+进行水体漂浮物像素级分割与报警系统开发

请说说如何改进U-Net模型和DeepLabv3+模型用于提取雷达遥感水体信息的神经网络，并给出他们的模型代码

使用python的deeplabv3+来进行批量处理图片，分析图片中天空，水体，动物，植被，人，建筑物在图片中的占比的完整代码及注释

深度学习语义分割方法在遥感影像分割中的性能分析.pdf

基于深度学习的高分遥感影像水体提取模型研究.pdf

Deeplabv3plus在DeepGlobe土地覆盖分类中的应用

Python入门系列专栏目录及前言

Cherry Studio中的智能助手.xlsx

专栏目录

最新推荐

自适应复杂网络结构中的同步现象解析

OpenVX：跨平台高效编程的秘诀

语音情感识别：预加重滤波器与清音影响分析

SSH连接与操作全解析

言语节奏与大脑定时模式：探索神经机制与应用

计算机视觉中的概率图模型：不完整数据下的贝叶斯网络学习

网络数据上的无监督机器学习

利用大数据进行高效机器学习

HNPU-V1：自适应DNN训练处理器的技术解析与性能评估

具有多重时滞和不确定参数的CRDNNs的无源性与同步性研究