矩阵相似性搜索的渐进式方法

立即解锁

发布时间: 2025-08-22 02:18:57 阅读量: 2 订阅数: 10

空间与时间数据库进展：SSTD 2015会议记录

### 矩阵相似性搜索的渐进式方法 #### 1. 渐进搜索算法在矩阵的最近邻（NN）搜索中，采用了一种渐进搜索算法。该算法使用最小堆 `H` 来按条目下界距离的升序处理条目。`H` 包含两种类型的条目：候选条目和候选组。初始时，`H` 包含一个覆盖整个数据矩阵 `D` 的候选组条目。搜索流程如下： 1. 从 `H` 中取出一个条目，检查它是候选组还是候选条目。 2. **如果是候选组 `G`**：将其均匀划分为 4 个候选组 `G1, G2, G3, G4`，计算每个 `Gi` 的组下界 `LB(q, Gi)`，然后将 `Gi` 重新加入 `H`。 3. **如果是候选条目 `c`**：计算下一级 `ℓ` 的候选下界 `LBlevel,ℓ(q, c)`，然后将 `c` 重新加入 `H`。 4. 当候选组只覆盖一个候选条目时，它会退化为候选条目；当候选条目达到最深级别时，直接应用精确距离函数 `dist(q, c)` 并更新到目前为止找到的最佳 NN 距离 `τbest`。 5. 当取出条目的下界超过 `τbest` 时，搜索终止。以下是该搜索方法的流程图： ```mermaid graph TD; A[min - heap H] --> B[deheap an entry]; B --> C{Is it a group?}; C -- Yes --> D[Divide it into 4 groups]; D --> E[Apply LBgroup to these groups]; E --> F[Enheap them to H]; C -- No --> G[Apply LBlevel to it]; G --> H[Increment level]; H --> I[Enheap it to H]; I --> J{Reach the deepest level?}; J -- Yes --> K[Compute exact distance]; J -- No --> I; K --> L[Update τbest]; ``` 该算法使用的下界函数类型如下表所示： | 函数 | 应用对象 | 成本 | | ---- | ---- | ---- | | `LBbasic` (e.g., `LBΔ`, `LB⊕`) | 候选条目 | O(1) | | `LBlevel,ℓ` | 候选条目 | O(4ℓ) | | `LBgroup` | 候选组 | O(α) | #### 2. 候选条目的渐进过滤为了节省昂贵的距离计算，提出了使用 `LBbasic` 作为构建块来构造参数化下界函数 `LBlevel,ℓ` 的通用思想。级别参数 `ℓ` 控制着 `LBlevel,ℓ` 中边界紧密度和计算时间之间的权衡。较小的 `ℓ` 计算时间短，而较大的 `ℓ` 提供更紧密的边界。构建 `LBlevel,ℓ` 的方法是分治法，将空间 `[1..Lq, 1..Wq]` 划分为 `4ℓ` 个不相交的矩形 `{Rv : 1 ≤ v ≤ 4ℓ}`，在每个矩形 `Rv` 中应用 `LBbasic`，然后将这些 `4ℓ` 个下界距离组合成 `LBlevel,ℓ`： \[LB_{level,\ell}(q, c) = \sqrt[p]{\sum_{v = 1}^{4^{\ell}} LB_{basic}(q[R_v], c[R_v])^p}\] 最大可能级别 `ℓmax` 为： \[\ell_{max} = \lceil\log_2(\max\{L_q, W_q\})\rceil\] 可以证明 `LBlevel,ℓ` 满足下界属性，即对于任何候选条目 `c`，有 `LBlevel,ℓ(q, c) ≤ distp(q, c)`。在搜索过程中，按 `ℓ` 的升序对候选条目应用 `LBlevel,ℓ`。如果在级别 `ℓ` 不能过滤 `c`，则尝试在级别 `ℓ + 1` 进行过滤。升序 `ℓ` 顺序的成本 `costorder` 满足 `costorder ≤ 4/3 · costopt`，其中 `costopt` 是最优成本。 #### 3. 候选组的渐进过滤候选组 `G` 表示连续的候选条目区域，包含大小属性 `Lg` 和 `Wg` 以及起始位置 `(xstart, ystart)`。为了覆盖组中的所有候选条目，定义扩展区域 `G.Rext`。引入了最小/最大 `Nq` 值的概念，定义了 `Nq min(G.Rext)`、`φmin(G.Rext)`、`φp min(G.Rext)` 及其最大值版本。基于这些概念，提出了候选组的下界函数 `LB⊕ group` 和 `LBΔ group`： \[LB_{\oplus_{group}}(q, G) = \begin{cases} \sqrt[p]{N_q}(\varphi_{min}(G.R_{ext}) - \sum^*q) & \text{if } \varphi_{min}(G.R_{ext}) > \sum^*q \\ \sqrt[p]{N_q}(\sum^*q - \varphi_{max}(G.R_{ext})) & \text{if } \varphi_{max}(G.R_{ext}) < \sum^*q \\ 0 & \text{otherwise} \end{cases} \] \[LB_{\Delta_{group}}(q, G) = \begin{cases} \sqrt[p]{\varphi_{p_{min}}(G.R_{ext}) - \sum^*|q[i, j]|^p} & \text{if } \varphi_{p_{min}}(G.R_{ext}) > \sum^*|q[i, j]|^p \\ \sqrt[p]{\sum^*|q[i, j]|^p - \varphi_{p_{max}

最低0.47元/天解锁专栏

赠100次下载

继续阅读点击查看下一篇

400次会员资源下载次数

300万+ 优质博客文章

1000万+ 优质下载资源

1000万+ 优质文库回答

复制全文

矩阵相似性搜索的渐进式方法

相关推荐

专栏目录

矩阵相似性搜索的渐进式方法

相关推荐

Raven 彩色渐进矩阵对 Anglo 和墨西哥裔美国儿童的可靠性

RPM-AI-Agent:AI代理，用于解决Raven的渐进矩阵问题，作为对通用智力的测试

通过渐进矢量场共识进行图像特征匹配

矩阵相似性搜索与非合规窗口共现模式发现

最小多项式和JORDAN标准型：矩阵理论中的突破性进展

矩阵论深度剖析：最小多项式在JORDAN标准型构建中的关键作用

【线性代数核心应用】：矩阵运算与系统分析的高等数学视角

【序列分析基础】序列比对的评价标准：得分矩阵、间隙罚分等

矩阵分解推荐系统：冷启动问题及解决方案，让推荐系统从零到一

向量搜索在蚂蚁金服的实践：ZSearch案例研究，揭示金融搜索的未来趋势

Spark 高分笔记

双有源桥DCDC变换器控制方式解析：变占空比移相控制与单PWM+SPS及双PWM控制

专栏目录

最新推荐

【EMV芯片卡的普及】：消费者教育与市场接受度的3大分析

【数据融合艺术】：AD597与其他传感器集成的高级技巧

性能瓶颈排查：T+13.0至17.0授权测试的性能分析技巧

【游戏自动化测试专家】：ScriptHookV测试应用与案例深入分析（测试效率提升手册）

ISTA-2A合规性要求：最新解读与应对策略

【MATLAB频谱分析】：揭秘振动信号背后频率的3大秘密

【Cadence AD三维封装库实现】：Step后缀3D模型导入与应用技巧

TB67S109A与PCB设计结合：电路板布局的优化技巧

Android语音合成与机器学习融合：利用ML模型提升语音质量

【LT8619B&LT8619C视频同步解决方案】：同步机制故障排除与信号完整性测试