数模学习day11-系统聚类法

WenJGo

已于 2025-04-19 21:10:33 修改

阅读量3.4k

点赞数 28

CC 4.0 BY-SA版权

分类专栏：数学建模文章标签：数学建模

于 2024-01-10 19:24:04 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/DDDDWJDDDD/article/details/135509800

数学建模专栏收录该内容

24 篇文章

订阅专栏

本文详细介绍了系统聚类法，包括样品间、指标间以及类间距离的计算方法，展示了最短距离和最长距离法的实际应用，并提到了在SPSS中的实现步骤。同时讨论了聚类分析中需要注意的关键问题，如指标选择、距离定义和方法选择等。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

本文参考辽宁石油化工大学于晶贤教授的演示文档聚类分析之系统聚类法及其SPSS实现。

目录

1.样品与样品间的距离

2.指标和指标间的“距离”

3.类与类间的距离

（1）类间距离

（2）类间距离定义方式

1.最短距离法

2.最长距离法

3.组间平均连接法

4.组内平均连接法

4.常用系统聚类法

系统聚类法过程

最短距离系统聚类法

1.写出样品间的距离矩阵(以欧氏距离为例）

2.将每一个样品看做是一个类

3.观察 D（G2,G4）= 15.9最小

4.观察 D（G6,G7）= 18.2最小

5.最后将G8与G3聚为一类，记为G9

6.该聚类的谱系图

最长距离系统聚类法

1.写出样品间的距离矩阵(以欧氏距离为例）

2.将每一个样品看做是一个类

3.观察 D（G2,G4）= 15.9最小

4.观察 D（G63,G7）= 32.4最小

5.最后将G8与G6聚为一类，记为G9

6.该聚类的谱系图

其它系统聚类法

聚类分析需要注意的问题

系统聚类法的Spss实现

3.统计量和绘制选项

4.方法和保存选项

1.样品与样品间的距离

各种距离如下：

最常用的还是绝对值距离（特定距离），和欧式距离

举例使用如下

2.指标和指标间的“距离”

相关系数

夹角余弦

举例如下

3.类与类间的距离

（1）类间距离

由一个样品组成的类是最基本的类，如果每一类都由一个样品组成，那么样品间的距离就是类间距离。

（2）类间距离定义方式

如果某一类包含不止一个样品，那么就要确定类间距离，类间距离是基于样品间距离定义的，大致有如下几种定义方式：

1.最短距离法

2.最长距离法

3.组间平均连接法

4.组内平均连接法

5.重心法

4.常用系统聚类法

系统聚类法过程

5.例子

最短距离系统聚类法

1.写出样品间的距离矩阵(以欧氏距离为例）

2.将每一个样品看做是一个类

G1，G2，G3，G4，G5，观察D(G1,G5) = 15.8最小，故将G1与G5聚为一类，记为G6。

计算新类与其余各类之间的距离，得到新的距离矩阵D1

3.观察 D（G2,G4）= 15.9最小

故将G2与G4聚为一类，记为G7.

计算新类与其余各类之间的距离，得到新的距离矩阵D2

4.观察 D（G6,G7）= 18.2最小

故将G6与G7聚为一类，记为G8.

计算新类与其余各类之间的距离，得到新的距离矩阵D3

5.最后将G8与G3聚为一类，记为G9

6.该聚类的谱系图

最长距离系统聚类法

1.写出样品间的距离矩阵(以欧氏距离为例）

2.将每一个样品看做是一个类

即G1，G2，G3，G4，G5，观察D(G1,G5) = 15.8最小，故将G1与G5聚为一类，记为G6。

计算新类与其余各类之间的距离，得到新的距离矩阵D1

3.观察 D（G2,G4）= 15.9最小

故将G2与G4聚为一类，记为G7.

计算新类与其余各类之间的距离，得到新的距离矩阵D2

4.观察 D（G63,G7）= 32.4最小

故将G3与G7聚为一类，记为G8.

计算新类与其余各类之间的距离，得到新的距离矩阵D3

5.最后将G8与G6聚为一类，记为G9

6.该聚类的谱系图

其它系统聚类法

（1）组间平均连接系统聚类法
（2）重心系统聚类法
（3）组内平均连接系统聚类法

注：这些方法的差别就是在计算新类与其余各类间的距离，
如需学习详细内容，可参考多元统计分析相关书籍。

参考教材：《多元统计分析》，何晓群，中国人民大学出版社，2008.
《多元统计分析》，于秀林，中国统计出版社，2006.

聚类分析需要注意的问题

（1）对于一个实际问题要根据分类的目的来选取指标，指标选取的不同分类结果一般也不同。
（2）样品间距离定义方式的不同，聚类结果一般也不同。
（3）聚类方法的不同，聚类结果一般也不同（尤其是样品特别多的时候）。最好能通过各种方法找出其中的共性。
（4）要注意指标的量纲，量纲差别太大会导致聚类结果不合理。
（5）聚类分析的结果可能不令人满意，因为我们所做的是一个数学的处理，对于结果我们要找到一个合理的解释。

系统聚类法的Spss实现

1.录入数据

2.选择方法

3.统计量和绘制选项

4.方法和保存选项

总结

知识点较多，但是一通百通，具体大家可以参考于晶贤老师的具体内容。

ヾ(￣▽￣)Bye~Bye~

博客等级

码龄3年

全栈领域优质创作者

436
原创

1万+
点赞

8963
收藏

1万+
粉丝

关注

私信

猜你想问

如何选择合适的距离定义方法？

最长距离法有哪些实际应用场景？

SPSS中实现聚类分析的关键步骤是什么？

热门文章

分类专栏

Python之路 99篇
我的算法记录 213篇
AI学习之路 107篇
论文理解 27篇
无人机 4篇
游戏开发 1篇
Android开发 17篇
Java之路 28篇
C++之路 11篇
纠错分析 3篇
数学建模 24篇
Python爬虫 15篇
蓝桥杯 38篇
里程碑 3篇
Vue 14篇
前端HTMLCSSJS 15篇
数据库 1篇
Dubbo 1篇
分布式 1篇

展开全部收起

上一篇：: 数模学习day10-聚类模型

下一篇：: 力扣最热一百题——96.只出现一次的数字

最新评论

论文研读——《RADAR:稳健的两阶段模态不完全工业异常检测》
ShowerCC: deepseek？
用Python与OpenCV的实践：实时面部对称性分析
itsmelan: 看起来超厉害
OpenCV+mediapipe实现——手势识别（比心特效）
yydm: 总结==null
Python爬虫——Scrapy-1
北风之神c: 你这个scrapy爬虫总结的很全面很有条理，写得好赞，博主用心了！但是scrapy来爬虫非常麻烦，写法难度高，国产分布式函数调度框架 funboost python万能通用函数加速器 https://funboost.readthedocs.io/zh-cn/latest/articles/c8.html ，只需要@boost一行代码，加到任意新/旧爬虫项目就又强又自由又简单。此框架如果用于爬虫，不管从任何方面比较可以领先scrapy 20年，因为从根本理念上对scrapy api方式的框架造成巨大的降维打击。昔有Scrapy窃据神器，挟Twisted之技而令诸侯，然其框架繁苛，回调如狱，岁月更迭，其势已衰，其道已孤，弊病丛生，开发者苦之久矣！今有Funboost，顺天应人，聚函数神力，携`@boost`之雷霆，以大道至简之义，破枷锁，扫陈规，伐无道，正本清源，布告天下！此诚不可逆之大势也！依托于funboost的强大可视化管理，不登录机器可以轻松掌控分布式大规模爬虫运行状态，一目了然。可视化截图： https://funboost.readthedocs.io/zh-cn/latest/articles/c13.html Scrapy十败如山崩，Funboost十胜如日升！ funboost剑锋所指，scrapy框架枷锁必将斩断！函数光辉，普照四海！ pip install funboost
数据结构——字符串匹配算法：朴素的匹配算法和KMP算法（超详细解释新手也能会学！！！）
是折纸呀.: 来点难题，不然以为你在炸鱼

大家在看

最新文章

2025

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

WenJGo 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。