结合多分辨率证据对Flickr图像进行地理参考

# 结合多分辨率证据对Flickr图像进行地理参考 ## 1 概率估计与朴素贝叶斯的局限性在地理参考Flickr图像时，我们需要对概率进行估计。对于在区域a中包含标签t的图像数量记为$N_t$，区域a中所有图像的标签出现总数为$\sum_{y\in X_a} |y|$，词汇表记为V。$P(t|a)$的估计方法源于拉普拉斯的接续法则，其计算公式为： $$P(t|a)=\frac{N_t + 1}{\sum_{y\in X_a} |y| + |V|}$$ 而最大似然估计$\frac{N_t}{\sum_{y\in X_a} |y|}$在这里并不实用，因为一旦图像x有一个标签在位于区域a的训练集中未出现，就会导致$P(a|x) = 0$。区域a的先验概率$P(a)$可以使用最大似然法可靠地估计： $$P(a)=\frac{|X_a|}{\sum_{b\in A} |X_b|}$$ 最后，对于所有$a\in A$，$P(a|x)$的实际值在归一化后由上述公式得出。朴素贝叶斯在地理参考图像时存在一定局限性。它将区域视为抽象类别，忽略了区域的空间分布信息。例如，假设$A = \{a, b, c, d\}$，对于给定照片x，朴素贝叶斯分类器得出$P(a|x) = 0.3$，$P(b|x) = 0.25$，$P(c|x) = 0.25$，$P(d|x) = 0.2$。若b、c、d是相邻区域，而a位于不同城市，那么正确位置更可能靠近{b, c, d}区域，但朴素贝叶斯基本形式会忽略这一信息。 ## 2 结合Dempster - Shafer理论的分类器 ### 2.1 动机为了让朴素贝叶斯更具空间感知能力，我们提出在多个分辨率上应用相关方法并结合结果。设$\{A_1, ..., A_k\}$是将感兴趣的城市划分为不相交区域的不同聚类，其中$A_1$对应最细粒度的聚类，$A_k$对应最粗粒度的聚类，即$|A_1| > |A_2| > ... > |A_k|$。$C_i$是经过训练以找出给定照片拍摄区域（来自$A_i$）的分类器。对于$a\in A_i$，$areas(a)$表示与区域a重叠的$A_1$中的区域集合。这样，较粗分辨率的分类可以看作是最细分辨率下的不完整分类。 ### 2.2 获取质量分配在Dempster - Shafer理论中，宇宙U中的质量分配m将U的任何子集映射到[0, 1]的值，使得$\sum_{X\subseteq U} m(X) = 1$且$m(\varnothing) = 0$。直观地说，$m(X)$表示正确值在X中的证据量。$m(X) > 0$的子集X称为焦点元素。对于任何$X\subseteq U$，通常定义两个不确定性度量： $$Bel(X)=\sum_{Y\subseteq X} m(Y)$$ $$Pl(X)=\sum_{Y\cap X\neq\varnothing} m(Y)$$ $Bel(X)$可解释为X包含正确值的概率下限，$Pl(X)$是该概率的上限。在本文中，宇宙始终是最细粒度聚类中的区域（聚类）集合，即集合$A_1$。设$p_i(a)$是分类器$C_i$为照片分配给区域$a\in A_i$的概率。对应于分类器$C_i$的质量分配（$X\subseteq A_1$）为： $$m_i(X)=\begin{cases}p_i(a) & \text{如果 } X = areas(a) \text{ 对于某些 } a\in A_i \\ \sum_{a\in (A_i\setminus \hat{A}_i)} p_i(a) & \text{如果 } X = A_1 \\ 0 & \text{否则}\end{cases}$$ 其中$\hat{A}_i\subseteq A_i$是根据分类器$C_i$最可能的区域集合。在实验中，$\hat{A}_i$是按可能性降序添加区域构建的，直到$\sum_{a\in \hat{A}_i} p_i(a) \geq 0.95$。 ### 2.3 结合质量分配使用Dempster - Shafer理论的一个重要优势是它允许结合来自不同来源的证据。对于宇宙$A_1$中的两个质量分配m和$m'$，联合质量分配$m\oplus m'$使用Dempster组合规则定义： $$(m \oplus m')(\varnothing) = 0$$ $$(m \oplus m')(X)=\frac{\sum_{Y\cap Z = X} m(Y) \cdot m'(Z)}{1 - \sum_{Y\cap Z = \varnothing} m(Y) \cdot m'(Z)}$$ 对于任何子集$\varnothing\subset X\subseteq A_1$，且$\sum_{Y\cap Z = \varnothing} m(Y) \cdot m'(Z) < 1$。通过将分类器$C_1, ..., C_k$视为独立来源，我们得到质量分配$m = m_1 \oplus m_2 \oplus ... \oplus m_k$。然而，Demp

最低0.47元/天解锁专栏

赠100次下载

继续阅读点击查看下一篇

400次会员资源下载次数

300万+ 优质博客文章

1000万+ 优质下载资源

1000万+ 优质文库回答

复制全文

结合多分辨率证据对Flickr图像进行地理参考

相关推荐

专栏目录

结合多分辨率证据对Flickr图像进行地理参考

相关推荐

flickr_scraper:简单的Flickr图像抓取工具

对 Flickr 数据集展开全面分析探讨

python作业-基于Flickr30k数据集实现图像文本跨模态搜索python源码+数据集+测试界面+项目说明.zip

flickr-downloader:下载 Flickr 图像的实用程序

flickr:从标签字典中输出 flickr 图像 URL 列表

cc-flickr:Flickr 图像的知识共享属性生成器

flickr-search:用于搜索和显示 Flickr 图像的界面

FlickrImageSearchMVVM:Flickr图像搜索应用程序

ios源码之在谷歌地图上显示最近在Flickr上进行地理标记的照片FlickrKML.rar

Sketch-Quick-Pic:使用带有标签的 Flickr 图像填充图像层

浅析Linux设备DMA机制：DMA内存映射

牛津译林版初中英语《Grammar：Comparative-and-superlative-adje.doc

专栏目录

最新推荐

自适应复杂网络结构中的同步现象解析

OpenVX：跨平台高效编程的秘诀

利用大数据进行高效机器学习

SSH连接与操作全解析

语音情感识别：预加重滤波器与清音影响分析

计算机视觉中的概率图模型：不完整数据下的贝叶斯网络学习

具有多重时滞和不确定参数的CRDNNs的无源性与同步性研究

言语节奏与大脑定时模式：探索神经机制与应用

网络数据上的无监督机器学习

HNPU-V1：自适应DNN训练处理器的技术解析与性能评估