结合多分辨率证据对Flickr图像进行地理参考
立即解锁
发布时间: 2025-08-30 01:53:20 阅读量: 7 订阅数: 11 AIGC 

# 结合多分辨率证据对Flickr图像进行地理参考
## 1 概率估计与朴素贝叶斯的局限性
在地理参考Flickr图像时,我们需要对概率进行估计。对于在区域a中包含标签t的图像数量记为$N_t$,区域a中所有图像的标签出现总数为$\sum_{y\in X_a} |y|$,词汇表记为V。$P(t|a)$的估计方法源于拉普拉斯的接续法则,其计算公式为:
$$P(t|a)=\frac{N_t + 1}{\sum_{y\in X_a} |y| + |V|}$$
而最大似然估计$\frac{N_t}{\sum_{y\in X_a} |y|}$在这里并不实用,因为一旦图像x有一个标签在位于区域a的训练集中未出现,就会导致$P(a|x) = 0$。区域a的先验概率$P(a)$可以使用最大似然法可靠地估计:
$$P(a)=\frac{|X_a|}{\sum_{b\in A} |X_b|}$$
最后,对于所有$a\in A$,$P(a|x)$的实际值在归一化后由上述公式得出。
朴素贝叶斯在地理参考图像时存在一定局限性。它将区域视为抽象类别,忽略了区域的空间分布信息。例如,假设$A = \{a, b, c, d\}$,对于给定照片x,朴素贝叶斯分类器得出$P(a|x) = 0.3$,$P(b|x) = 0.25$,$P(c|x) = 0.25$,$P(d|x) = 0.2$。若b、c、d是相邻区域,而a位于不同城市,那么正确位置更可能靠近{b, c, d}区域,但朴素贝叶斯基本形式会忽略这一信息。
## 2 结合Dempster - Shafer理论的分类器
### 2.1 动机
为了让朴素贝叶斯更具空间感知能力,我们提出在多个分辨率上应用相关方法并结合结果。设$\{A_1, ..., A_k\}$是将感兴趣的城市划分为不相交区域的不同聚类,其中$A_1$对应最细粒度的聚类,$A_k$对应最粗粒度的聚类,即$|A_1| > |A_2| > ... > |A_k|$。$C_i$是经过训练以找出给定照片拍摄区域(来自$A_i$)的分类器。对于$a\in A_i$,$areas(a)$表示与区域a重叠的$A_1$中的区域集合。这样,较粗分辨率的分类可以看作是最细分辨率下的不完整分类。
### 2.2 获取质量分配
在Dempster - Shafer理论中,宇宙U中的质量分配m将U的任何子集映射到[0, 1]的值,使得$\sum_{X\subseteq U} m(X) = 1$且$m(\varnothing) = 0$。直观地说,$m(X)$表示正确值在X中的证据量。$m(X) > 0$的子集X称为焦点元素。对于任何$X\subseteq U$,通常定义两个不确定性度量:
$$Bel(X)=\sum_{Y\subseteq X} m(Y)$$
$$Pl(X)=\sum_{Y\cap X\neq\varnothing} m(Y)$$
$Bel(X)$可解释为X包含正确值的概率下限,$Pl(X)$是该概率的上限。
在本文中,宇宙始终是最细粒度聚类中的区域(聚类)集合,即集合$A_1$。设$p_i(a)$是分类器$C_i$为照片分配给区域$a\in A_i$的概率。对应于分类器$C_i$的质量分配($X\subseteq A_1$)为:
$$m_i(X)=\begin{cases}p_i(a) & \text{如果 } X = areas(a) \text{ 对于某些 } a\in A_i \\ \sum_{a\in (A_i\setminus \hat{A}_i)} p_i(a) & \text{如果 } X = A_1 \\ 0 & \text{否则}\end{cases}$$
其中$\hat{A}_i\subseteq A_i$是根据分类器$C_i$最可能的区域集合。在实验中,$\hat{A}_i$是按可能性降序添加区域构建的,直到$\sum_{a\in \hat{A}_i} p_i(a) \geq 0.95$。
### 2.3 结合质量分配
使用Dempster - Shafer理论的一个重要优势是它允许结合来自不同来源的证据。对于宇宙$A_1$中的两个质量分配m和$m'$,联合质量分配$m\oplus m'$使用Dempster组合规则定义:
$$(m \oplus m')(\varnothing) = 0$$
$$(m \oplus m')(X)=\frac{\sum_{Y\cap Z = X} m(Y) \cdot m'(Z)}{1 - \sum_{Y\cap Z = \varnothing} m(Y) \cdot m'(Z)}$$
对于任何子集$\varnothing\subset X\subseteq A_1$,且$\sum_{Y\cap Z = \varnothing} m(Y) \cdot m'(Z) < 1$。通过将分类器$C_1, ..., C_k$视为独立来源,我们得到质量分配$m = m_1 \oplus m_2 \oplus ... \oplus m_k$。
然而,Demp
0
0
复制全文
相关推荐










