向量相似度度量(三):科普-为什么度量方式很重要

本文科普地介绍了直方图比较在图像相似性度量中的应用,对比了bin-by-bin与cross-bin两种方式,即L1距离与quadratic-form distance,并通过实例说明了量化误差对相似性判断的影响。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >


同样,这个解释来自于前述文章提到的论文。可能初做这个技术领域的人不是很在乎如何度量,只是找一个差不多的把系统搭起来。其实度量的好坏直接影响着最后的效果。下面的图示可以很好的阐述这一点。

首先,我们看两组直方图,

  • 图(a)使用了bin-by-bin的直方图比较方式L1距离,即每个bin和另一个直方图的对应bin作比较,绝对值求和。左图的两个直方图距离为4,右图为2,显然L1距离显示左图中的两个直方图相似性要弱于右图。
  • 图(b)使用了cross-bin的直方图比较方式quadratic-form distance,这个距离考虑的bin之间的关系,公式如下。它的比较结果依然会认为左图相似性弱于右图。



但是,按照两种距离度量的机制,我们可以比较容易的思考到,下图比较方式会更加合理。图(c)显示,如果是bin和bin比较,那么稍微错一格进行比较,岂不是很完美?图(d)也同样,cross-bin的比较这样比会更加合理。

为什么左图的一对直方图是很相似呢?从图像的例子可以很容易的理解。大家知道图像的8bit灰度值是0-255,如果直方图是32个bin,代表对图像做量化,量化步长为8。如果有个图像像素值是128(灰不溜秋的颜色),量化后(这里方便起见直接除以8了)属于bin=16。但是如果另一个另一个图像的像素值是129,我们直观看起来都会觉得这俩像素长得太像了,但是直方图的结果却是归到了bin=17。这就带来了上述例子的结果,图像很相似,但是距离反而不小。



这篇文章很科普,很傻瓜,不过感觉很直观能表达一个道理,权当一片文章吧。



https://blog.csdn.net/wangdonggg/article/details/35280735
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值