活动介绍

基于LLA方法的对象或类别比较及相似性指标分析

立即解锁
发布时间: 2025-08-23 02:06:30 阅读量: 2 订阅数: 11
PDF

组合与统计数据分析及聚类的基础与方法

### 基于LLA方法的对象或类别比较及相似性指标分析 在数据分析和分类问题中,比较对象或类别以及计算它们之间的相似性是非常重要的任务。本文将介绍基于LLA方法的对象或类别比较,以及几种不同类型的相似性指标。 #### 1. 二元属性下的相关计算 引入 $\varphi = 2f_1f_2$ 后,有如下公式: $M_1 = \varphi p + (1 - \varphi)q$ $M_2 = \varphi p^2 + (1 - \varphi)q^2$ 此时,方差等于 $\varphi(1 - \varphi)(q - p)^2$。对于 $p$ 和 $q$ 值的归一化贡献分别为: - $-\sqrt{\frac{1 - \varphi}{\varphi}}$ - $\sqrt{\frac{\varphi}{1 - \varphi}}$ 值得注意的是,这些归一化贡献不依赖于 $p$ 和 $q$ 的值,这是一个自然且合适的性质,因为由二元属性描述的对象之间的相似性不应依赖于为该二分法的两个值分配的数值估值。 $\varphi$ 的取值范围是区间 $[0, 0.5]$,当 $f_1 = f_2 = 0.5$ 时达到值 $0.5$。上述第一个(分别对应第二个)项中 $\varphi$ 的函数,当 $\varphi$ 从 $0$ 变化到 $0.5$ 时,会增加(分别对应减少)。当 $\varphi = 0.5$ 时,可获得最大对立,此时相应的值分别等于 $-1$ 和 $+1$。 以二元属性为例,若专家认为一个给定类别与其自身的相似性对于两个类别并不相同,比如认为类别 2 与其自身的相似性强于类别 1 与其自身的相似性,那么预序关系可建立为:$(1, 2) < (1, 1) < (2, 2)$。 #### 2. 分类共识问题的解决:基于分类属性的对象相似性指标 分类属性被解释和表示为一种预序分类属性,其值集由分类法的叶集 $T$ 定义。这种预序在 $T$ 上的建立方式具有超度量性,每个内部节点 $\nu$ 对应一个叶簇。 分类法的每个节点(包括根节点和叶节点)都被分配一个整数级别索引,根索引为 1,给定节点的索引是 1 加上从根到该节点的后代分支数。分类法的深度是从根到叶的最大后代分支数,若用 $k - 1$ 表示该值,那么 $k$ 就是该分类法中叶的最大索引。 分类属性可以用有序的分区序列 $P = (P_0, P_1, \cdots, P_{h - 1}, P_h, \cdots, P_{k - 1})$ 来表示。$P_0$ 是最细的分区,其类是单例,每个类恰好包含类别集中的一个元素;$P_{k - 1}$ 是最粗的分区,恰好包含一个将整个类别集分组的类。 对于有序类别对集合 $K_2 = \{(g, h)|1 \leq g \leq h \leq K\}$ 的总预序类序列 $L = (L_1, L_2, \cdots, L_q, \cdots, L_r)$ 的构建方式如下: - 如果 $C_{k - 2}$ 和 $D_{k - 2}$ 是分区 $P_{k - 2}$ 的两个类,它们在只有一个类的分区 $P_{k - 1}$ 中合并,那么每个满足 $g \leq h$ 的有序对 $(g, h)$(其中 $g \in C_{k - 2}$ 且 $h \in D_{k - 2}$ 或 $g \in D_{k - 2}$ 且 $h \in C_{k - 2}$)被分配到第一个预序类 $L_1$。 - 类似地,如果 $C_{k - 3}$ 和 $D_{k - 3}$ 是分区 $P_{k - 3}$ 的两个类,它们在分区 $P_{k - 2}$ 的一个类中合并,那么每个满足 $g \leq h$ 的有序对 $(g, h)$(其中 $g \in C_{k - 3}$ 且 $h \in D_{k - 3}$ 或 $g \in D_{k - 3}$ 且 $h \in C_{k - 3}$)被分配到第二个预序类 $L_2$。 - 更一般地,$L_h$ 是由分区 $P_{k - h - 1}$ 到 $P_{k - h}$ 之间合并的类产生的,$1 \leq h \leq k - 1$。最后一个预序类 $L_r$(这里 $r = k$)由形式为 $(g, g)$ 的有序对组成,$1 \leq g \leq K$。 与分类属性相关的类别集上的超度量预序通过平均排名函数进行编码。比较由分类属性描述的对象,就相当于比较由预序属性描述的对象。 设 $o_i$ 和 $o_{i'}$ 是要根据分类属性 $\tau$ 进行比较的两个对象,原始相似性索引可以写成 $s(o_i, o_{i'}) = r(\tau(o_i), \tau(o_{i'}))$。设 $e$ 和 $g$ 分别是 $o_i$ 和 $o_{i'}$ 所拥有的类别,且 $e \leq g$。如果 $(e, g)$ 属于 $L_h$,$1 \leq h \leq k - 1$,则有: $r(e, g) = \sum_{1 \leq j < h} l_j + \frac{l_h + 1}{2}$ 对于 $l_h = card(L_h)$,$1 \leq h \leq k - 1$,可以通过将分区类型的概念推广到有序分区序列的类型来得到其数学公式。 基于分类属性的LLA层次聚类为分类共识问题提供了一个简单而有效的解决方案。给定有限对象集 $O$ 上的有限个层次分类树 $H_1, H_2, \cdots, H_j, \cdots, H_p$,问题在于将它们总结为一个单一的层次分类树 $H$,该树需要相对于不同的初始树进行定位。 在我们提出的解决方案中,将每个分类树 $H_j$ 解释为一个特定的分类分类属性,从而将对象之间的LLA相似性索引的构建归结为之前的处理方法。唯一的区别是,树的叶子与单例类别相关联,每个类别包含一个唯一的对象。 当在不同日期 $t_1, t_2, \cdots, t_j, \cdots, t_p$ 对给定对象集 $O$ 观察给定属性集 $A$ 时,会出现实际问题。对于每个日期 $t_j$,会构建一个由 $O \times A(j)$ 索引的数据表,通过固定的层次聚类方法得到一个层次分类树 $H_j$。如果序列 $(H_1, H_2, \cdots, H_j, \cdots, H_p)$ 对应一个稳定的演化期,那么将该序列的不同分类树总结为一个唯一的树是有意义的,这个唯一的树定义了不同 $H_j$ 之间的共识。 另一种解决该问题的替代方法是建立一个全局数据表,它是通过将不同的数据表水平并列得到的。新的数据表由 $O \times \bigcup_{1 \leq j \leq p} A(j)$ 索引。在这种情况下,可以根据上述一般原则构建 $O$ 上的相似性索引,即全局数据表列索引的不同描述属性的归一化贡献之和。总共有 $p \times card(A)$ 个属性,如果 $a$ 是 $A$ 的一个给定属性,“在日期 $t_j$ 的 $a$
corwn 最低0.47元/天 解锁专栏
赠100次下载
继续阅读 点击查看下一篇
profit 400次 会员资源下载次数
profit 300万+ 优质博客文章
profit 1000万+ 优质下载资源
profit 1000万+ 优质文库回答
复制全文

相关推荐

张_伟_杰

人工智能专家
人工智能和大数据领域有超过10年的工作经验,拥有深厚的技术功底,曾先后就职于多家知名科技公司。职业生涯中,曾担任人工智能工程师和数据科学家,负责开发和优化各种人工智能和大数据应用。在人工智能算法和技术,包括机器学习、深度学习、自然语言处理等领域有一定的研究
最低0.47元/天 解锁专栏
赠100次下载
百万级 高质量VIP文章无限畅学
千万级 优质资源任意下载
千万级 优质文库回答免费看
立即解锁

专栏目录

最新推荐

从近似程度推导近似秩下界

# 从近似程度推导近似秩下界 ## 1. 近似秩下界与通信应用 ### 1.1 近似秩下界推导 通过一系列公式推导得出近似秩的下界。相关公式如下: - (10.34) - (10.37) 进行了不等式推导,其中 (10.35) 成立是因为对于所有 \(x,y \in \{ -1,1\}^{3n}\),有 \(R_{xy} \cdot (M_{\psi})_{x,y} > 0\);(10.36) 成立是由于 \(\psi\) 的平滑性,即对于所有 \(x,y \in \{ -1,1\}^{3n}\),\(|\psi(x, y)| > 2^d \cdot 2^{-6n}\);(10.37) 由

区块链集成供应链与医疗数据管理系统的优化研究

# 区块链集成供应链与医疗数据管理系统的优化研究 ## 1. 区块链集成供应链的优化工作 在供应链管理领域,区块链技术的集成带来了诸多优化方案。以下是近期相关优化工作的总结: | 应用 | 技术 | | --- | --- | | 数据清理过程 | 基于新交叉点更新的鲸鱼算法(WNU) | | 食品供应链 | 深度学习网络(长短期记忆网络,LSTM) | | 食品供应链溯源系统 | 循环神经网络和遗传算法 | | 多级供应链生产分配(碳税政策下) | 混合整数非线性规划和分布式账本区块链方法 | | 区块链安全供应链网络的路线优化 | 遗传算法 | | 药品供应链 | 深度学习 | 这些技

量子物理相关资源与概念解析

# 量子物理相关资源与概念解析 ## 1. 参考书籍 在量子物理的学习与研究中,有许多经典的参考书籍,以下是部分书籍的介绍: |序号|作者|书名|出版信息|ISBN| | ---- | ---- | ---- | ---- | ---- | |[1]| M. Abramowitz 和 I.A. Stegun| Handbook of Mathematical Functions| Dover, New York, 1972年第10次印刷| 0 - 486 - 61272 - 4| |[2]| D. Bouwmeester, A.K. Ekert, 和 A. Zeilinger| The Ph

使用GameKit创建多人游戏

### 利用 GameKit 创建多人游戏 #### 1. 引言 在为游戏添加了 Game Center 的一些基本功能后,现在可以将游戏功能扩展到支持通过 Game Center 进行在线多人游戏。在线多人游戏可以让玩家与真实的人对战,增加游戏的受欢迎程度,同时也带来更多乐趣。Game Center 中有两种类型的多人游戏:实时游戏和回合制游戏,本文将重点介绍自动匹配的回合制游戏。 #### 2. 请求回合制匹配 在玩家开始或加入多人游戏之前,需要先发出请求。可以使用 `GKTurnBasedMatchmakerViewController` 类及其对应的 `GKTurnBasedMat

黎曼zeta函数与高斯乘性混沌

### 黎曼zeta函数与高斯乘性混沌 在数学领域中,黎曼zeta函数和高斯乘性混沌是两个重要的研究对象,它们之间存在着紧密的联系。下面我们将深入探讨相关内容。 #### 1. 对数相关高斯场 在研究中,我们发现协方差函数具有平移不变性,并且在对角线上存在对数奇异性。这种具有对数奇异性的随机广义函数在高斯过程的研究中被广泛关注,被称为高斯对数相关场。 有几个方面的证据表明临界线上$\log(\zeta)$的平移具有对数相关的统计性质: - 理论启发:从蒙哥马利 - 基廷 - 斯奈思的观点来看,在合适的尺度上,zeta函数可以建模为大型随机矩阵的特征多项式。 - 实际研究结果:布尔加德、布

元宇宙与AR/VR在特殊教育中的应用及安全隐私问题

### 元宇宙与AR/VR在特殊教育中的应用及安全隐私问题 #### 元宇宙在特殊教育中的应用与挑战 元宇宙平台在特殊教育发展中具有独特的特性,旨在为残疾学生提供可定制、沉浸式、易获取且个性化的学习和发展体验,从而改善他们的学习成果。然而,在实际应用中,元宇宙技术面临着诸多挑战。 一方面,要确保基于元宇宙的技术在设计和实施过程中能够促进所有学生的公平和包容,避免加剧现有的不平等现象和强化学习发展中的偏见。另一方面,大规模实施基于元宇宙的特殊教育虚拟体验解决方案成本高昂且安全性较差。学校和教育机构需要采购新的基础设施、软件及VR设备,还会产生培训、维护和支持等持续成本。 解决这些关键技术挑

利用GeoGebra增强现实技术学习抛物面知识

### GeoGebra AR在数学学习中的应用与效果分析 #### 1. 符号学视角下的学生学习情况 在初步任务结束后的集体讨论中,学生们面临着一项挑战:在不使用任何动态几何软件,仅依靠纸和笔的情况下,将一些等高线和方程与对应的抛物面联系起来。从学生S1的发言“在第一个练习的图形表示中,我们做得非常粗略,即使现在,我们仍然不确定我们给出的答案……”可以看出,不借助GeoGebra AR或GeoGebra 3D,识别抛物面的特征对学生来说更为复杂。 而当提及GeoGebra时,学生S1表示“使用GeoGebra,你可以旋转图像,这很有帮助”。学生S3也指出“从上方看,抛物面与平面的切割已经

探索人体与科技融合的前沿:从可穿戴设备到脑机接口

# 探索人体与科技融合的前沿:从可穿戴设备到脑机接口 ## 1. 耳部交互技术:EarPut的创新与潜力 在移动交互领域,减少界面的视觉需求,实现无视觉交互是一大挑战。EarPut便是应对这一挑战的创新成果,它支持单手和无视觉的移动交互。通过触摸耳部表面、拉扯耳垂、在耳部上下滑动手指或捂住耳朵等动作,就能实现不同的交互功能,例如通过拉扯耳垂实现开关命令,上下滑动耳朵调节音量,捂住耳朵实现静音。 EarPut的应用场景广泛,可作为移动设备的遥控器(特别是在播放音乐时)、控制家用电器(如电视或光源)以及用于移动游戏。不过,目前EarPut仍处于研究和原型阶段,尚未有商业化产品推出。 除了Ea

由于提供的内容仅为“以下”,没有具体的英文内容可供翻译和缩写创作博客,请你提供第38章的英文具体内容,以便我按照要求完成博客创作。

由于提供的内容仅为“以下”,没有具体的英文内容可供翻译和缩写创作博客,请你提供第38章的英文具体内容,以便我按照要求完成博客创作。 请你提供第38章的英文具体内容,同时给出上半部分的具体内容(目前仅为告知无具体英文内容需提供的提示),这样我才能按照要求输出下半部分。

人工智能与混合现实技术在灾害预防中的应用与挑战

### 人工智能与混合现实在灾害预防中的应用 #### 1. 技术应用与可持续发展目标 在当今科技飞速发展的时代,人工智能(AI)和混合现实(如VR/AR)技术正逐渐展现出巨大的潜力。实施这些技术的应用,有望助力实现可持续发展目标11。该目标要求,依据2015 - 2030年仙台减少灾害风险框架(SFDRR),增加“采用并实施综合政策和计划,以实现包容、资源高效利用、缓解和适应气候变化、增强抗灾能力的城市和人类住区数量”,并在各级层面制定和实施全面的灾害风险管理。 这意味着,通过AI和VR/AR技术的应用,可以更好地规划城市和人类住区,提高资源利用效率,应对气候变化带来的挑战,增强对灾害的