语义分割的评价指标

本文详细解析了语义分割中的 Dice系数和IoU(Intersection over Union)在评价模型效果上的区别与联系,涵盖了混淆矩阵、精度、召回等基本概念,并通过实例计算展示了PA、CPA、MPA和mIoU的计算方法。适合理解语义分割任务的性能评估指标。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

        语义分割任务常用的评价指标为Dice coefficient和mIoU。dice和Iou都是用来衡量两个集合之间相似性的度量,对于语义分割任务而言即用来评估网络预测的分割结果与人为标注结果之间的相似度。接下来将分别介绍两者之间的区别和联系。

0. 二分类的评价指标

        在介绍语义分割评价指标之前,先回顾一下分类算法的评价指标,混淆矩阵,accuracy,precision和recall,以及F1-score这5个指标。

混淆矩阵(confusion matrix)

 如上图所示,包含一个二分类的混淆矩阵和一个例子。对于一个二分类任务,可能出现如下四种情况:

  1. TP:表示一个样本被预测为正类,并且真实标签为正类
  2. FN:表示一个样本被预测为反例,但是真实标签为正例
  3. FP:表示一个样本被预测为正例,但是真实标签为反例
  4. TN:表示一个样本为预测为反例,并且真实标签为反例

上述四个标识的理解可以通过从右到左读取,即第一个表示为预测结果,第二个字母表示是否预测正确。举例:FP-第一个字母为P,即表示预测结果为positive(正例),第二个字母为F,即表示预测错误,那么表示原本真实标签应该是反例。

Accuracy(准确率)

表示预测正确的样本数量占全部样本的百分比,具体表示如下:

 缺点:当数据类别分布不平衡时,不能评价模型的好坏。

Precision(查准率)

表示模型预测为正例的所有样本中,预测正确(真实标签为正)样本的占比:

Recall (查全率)

表示所有真实标签为正的样本,有多大百分比被预测出来

F1-score 

表示precision和recall的调和平均数,具体公式如下:

1. 语义分割的评价指标

dice系数概念理解

dice系数是一种集合相似度度量函数,通常用于计算两个集合之间的相似度,取值范围在【0,1】之间,函数表达式如下:(分子乘以2是为了保证分母重复计算后取值范围在【0,1】之间)

 

IoU

定义:两个集合之间交集与并集之间的比值,函数表达式如下:

2. 语义分割和分类之间的联系与区别

  • 联系:语义分割任务本质上是分类任务
  • 区别:常规分类任务的对象是图像中的物体,而语义分割的对象是图像中像素点。

通过上面可知,语义分割本质是分类,因此评价分割算法的好坏,其混淆矩阵的获取是最关键的。

 如下图所示,假设在一种图像中,有一块72个像素点的区域标记为猫,一个70个像素点的区域标记为狗,然后通过网络推理得到结果,构建了如下的混淆矩阵。基于这个混淆矩阵分析,对评价指标像素准确率(Pixel Accuracy, PA),类别像素准确率(class Pixel Accuracy, CPA),类别平均像素准确率(MPA)和平均交并比(mIoU)分别进行分析

 PA: 像素准确率

含义:预测正确的像素值占总像素值的百分比(对应于分类中的准确率)

计算公式:

 CPA: 类别像素准确率

含义:在所有预测为类别i的像素点中,真实属于类别i的像素点所占的百分比(对应于分类的precision指标)

计算公式:

MPA:类别平均像素准确率

 含义:所有类别像素准确率之和的平均。

计算方法:首先求得每个类别的像素准确率,然后对它们求和再平均。


IoU: 交并比

含义:某个类别预测结果与真实标签之间交集与并集之间的比值

 计算公式(如上图所示):

MIoU:平均交并比

 含义:每个类别预测结果与真实标签之间交集与并集的比值,求和再平均。


 Dice系数

根据上述dice系数的定义,换算到混淆矩阵可以得到如下公式:

 参考链接

医学影像分割---Dice Loss - 知乎 (zhihu.com)https://zhuanlan.zhihu.com/p/86704421语义分割之dice loss深度分析(梯度可视化) - 知乎 (zhihu.com)https://zhuanlan.zhihu.com/p/269592183Dice系数(Dice coefficient)与mIoU与Dice Loss_lipengfei0427的博客-CSDN博客_dice系数https://blog.csdn.net/lipengfei0427/article/details/109556985【语义分割】评价指标:PA、CPA、MPA、IoU、MIoU详细总结和代码实现(零基础从入门到精通系列!)_西北种田文的博客-CSDN博客https://blog.csdn.net/sinat_29047129/article/details/103642140

### 图像分割模型的评价指标 #### 1. **交并比 (Intersection over Union, IoU)** IoU 是一种衡量两个区域重叠程度的重要指标,在图像分割任务中被广泛使用。它通过计算预测掩码与真实标签之间的交集与并集之比来量化两者的相似度[^1]。具体公式如下: ```python def iou_score(y_true, y_pred): intersection = (y_true * y_pred).sum() union = y_true.sum() + y_pred.sum() - intersection return intersection / union if union != 0 else 0 ``` 对于像素级分类的任务,通常会针对每个类别分别计算 IoU 并取平均值得到 mean IoU。 --- #### 2. **平均精度均值 (mean Average Precision, mAP)** mAP 是目标检测和实例分割领域中的核心评估标准之一。其定义是对所有类别的 AP 值求平均值,能够全面反映模型的整体性能[^2]。在图像分割场景下,mask mAP 特指基于分割掩码计算得到的 AP 均值。 - **mAP@X**: 这里的 X 表示 IOU 阈值,例如 [email protected] 意味着只考虑那些 IoU 超过 0.5 的预测结果。更高的阈值意味着更严格的要求。 - 计算方法:先为每种类别生成 PR 曲线,再通过对曲线下面积积分得出 AP,最后对所有类别的 AP 取平均即得 mAP。 --- #### 3. **精确率 (Precision)** Precision 定义为模型预测为正类的样本中有多少实际上是正类,主要用于衡量预测结果的准确性[^3]。其公式为: \[ \text{Precision} = \frac{\text{True Positives}}{\text{True Positives} + \text{False Positives}} \] 在语义分割或实例分割中,可以通过逐像素比较预测与真值来统计 TP 和 FP 数量。 --- #### 4. **召回率 (Recall)** Recall 表达的是实际为正类的样本中有多少被成功识别出来,侧重于覆盖范围而非错误数量。公式表示为: \[ \text{Recall} = \frac{\text{True Positives}}{\text{True Positives} + \text{False Negatives}} \] 同样地,在图像分割任务中可通过逐像素对比实现该指标的计算。 --- #### 综合考量:F1-Score 为了平衡 Precision 和 Recall,常引入 F1-Score 来综合评估模型表现。它是两者调和平均的结果,适用于需要兼顾准确性和覆盖率的情况。公式如下: \[ F1 = 2 \cdot \frac{\text{Precision} \times \text{Recall}}{\text{Precision} + \text{Recall}} \] --- ### 总结 图像分割模型的主要评价指标包括但不限于 IoU、mAP、Precision 和 Recall。其中 IoU 更加关注单个对象级别的匹配情况;而 mAP 则提供了多类别整体性能的宏观视角。Precision 和 Recall 分别代表了不同侧重点下的模型能力,最终可借助 F1-Score 实现二者的折衷分析。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值