探究模型架构和数据集大小对腹部CT图像分割的影响
立即解锁
发布时间: 2025-08-31 00:14:00 阅读量: 2 订阅数: 11 AIGC 

### 探究模型架构和数据集大小对腹部 CT 图像分割的影响
#### 1. 损失函数
在图像分割任务中,损失函数用于衡量原始图像和预测掩码之间的差异。常见的损失函数包括骰子系数损失、重建损失和完全损失。
- **骰子系数(Dice Coefficient)**:衡量原始图像和预测掩码之间的相对重叠程度,取值范围为 0 到 1,值越高表示重叠越好。该系数通过忽略背景类来解决数据集中的类别不平衡问题。在训练阶段,所有模型 - 数据集组合都仅使用骰子损失。
- **重建损失(Reconstruction Loss)**:当图像从实际尺寸调整到目标尺寸时使用,通过双线性插值方法插入二维空间中某点的值,以估计新的像素值。
- **完全损失(Complete Loss)**:作者引入的一个指标,用于表示考虑图像尺寸变化后的总损失,计算公式为:
\[
\text{Complete Loss} = \text{Reconstruction Loss} + \text{Dice Loss}
\]
#### 2. 模型
本研究比较了两种 U - Net 架构:标准 U - Net 和 Resized U - Net,使用了两种不同大小和图像维度(128×128 像素和 512×512 像素)的数据集。
- **标准 U - Net**:主要目标是利用编码器 - 解码器架构为给定的腹部 CT 创建完整准确的掩码。输入图像尺寸为 128×128 像素,采用 5 层架构并结合骰子损失。该模型时间效率高,计算成本低,约有 200 万个参数,但重建损失会显著增加完全损失,导致图像模糊和不准确。
- **Resized U - Net**:在标准 U - Net 的基础上,编码器和解码器各增加了两个中间层,达到每层 6 层的架构。该模型保持了图像的空间分辨率,避免了图像调整,将重建损失降至 0。每层包含两个卷积层、一个最大池化层和一个丢弃层,并对每个卷积层进行批量归一化。该模型的计算成本较高,约有 3400 万个参数,但在所有数据集上的完全损失有所改善,泛化能力更好。
模型对比情况如下表所示:
| 模型 | 输入尺寸 | 层数 | 参数数量 | 优点 | 缺点 |
| ---- | ---- | ---- | ---- | ---- | ---- |
| 标准 U - Net | 128×128 像素 | 5 层 | 约 200 万 | 时间效率高,计算成本低 | 重建损失大,图像质量差 |
| Resized U - Net | 512×512 像素 | 6 层 | 约 3400 万 | 完全损失低,泛化能力好 | 计算成本高 |
#### 3. 结果
通过超参数调整后,对每个模型 - 数据集组合的性能进行了比较,以平均完全损失的百分比变化来表示。
- **最优超参数**:不同模型 - 数据集组合的最优超参数如下表所示:
| 数据集 | 模型 | 批量大小 | 轮数 | 丢弃率 |
| ---- | ---- | ---- | ---- | ---- |
| 本地 | 标准 U - Net | 16 | 100 | 30% |
| 本地 | Resized U - Net | 16 | 100 | 50% |
| 全局 | 标准 U - Net | 16 | 80 | 30% |
| 全局 | Resized U - Net | 32 | 80 | 10% |
- **数据大小依赖性**:全局数据集(451)几乎是本地数据集(226)的两倍。两种模型在全局数据集上的验证集和测试集表现都更好。
- 标准 U - Net 在全局数据集上的验证集和测试集损失分别比本地版本降低了 14.99% 和 18.61%。
- Resized U - Net 在全局数据集上的验证集和测试集损失分别比本地版本降低了 3.29% 和 5.18%。
- **模型差异**:Resized U -
0
0
复制全文
相关推荐










