多个独立样本的非参检验

最新推荐文章于 2025-03-07 11:48:04 发布

原创最新推荐文章于 2025-03-07 11:48:04 发布 · 692 阅读

·

0

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#机器学习 #算法 #python

概率与统计专栏收录该内容

97 篇文章

订阅专栏

多个独立样本的非参检验

简介

多个独立样本的非参检验是一种常用的假设检验方法，通常用于比较多个独立样本之间的差异。其原理是通过对多个样本的秩次进行比较，来判断这些样本之间是否存在显著性差异。

基本概念

秩次

秩次（rank）是指将一组数据从小到大排序后，每个数据所在位置的序号。例如，对于以下一组数据：

$3, 6, 1, 8, 2$

排序后得到：

$1, 2, 3, 6, 8$

因此，每个数据的秩次分别为：

$3, 5, 1, 6, 2$

秩和

秩和（sum of ranks）是指所有数据的秩次之和。对于一个样本容量为 $n$ 的样本，其秩和为：

$\sum_{i=1}^n rank_i$

其中， $rank_i$ 为第 $i$ 个数据的秩次。

秩平均

秩平均（average rank）是指所有数据的秩次的平均数。对于一个样本容量为 $n$ 的样本，其秩平均为：

$\bar{R} = \frac{1}{n}\sum_{i=1}^n rank_i$

秩差和

秩差和（sum of rank differences）是指将一个样本的数据按照某一顺序排列后，每个数据的前后两个秩次之差的绝对值之和。对于一个样本容量为 $n$ 的样本，其秩差和为：

$\sum_{i=1}^n |rank_i-rank'_i|$

其中， $rank_i$ 为第 $i$ 个数据按照一定顺序排列后的秩次， $rank'_i$ 为该数据在原始样本中的秩次。

Kruskal-Wallis检验

Kruskal-Wallis检验是多个独立样本的非参检验方法之一，用于比较多个独立样本之间是否存在显著性差异。其基本思想是将所有样本的数据汇总到一起，然后计算每个数据的秩次，并根据秩次来进行比较。

Kruskal-Wallis检验的步骤如下：

根据问题确定原假设 $H_0$ 和备择假设 $H_1$ 。
将所有样本的数据汇总到一起，并计算每个数据的秩次。
计算每个样本的秩和 $R_i$ 、秩平均 $Riˉ\bar{R_i}$ 和样本容量 $n_i$ 。
计算秩差和 $W$ 。
计算检验统计量 $H=12N(N+1)∑i=1kRi2ni−3(N+1)H=\frac{12}{N(N+1)}\sum_{i=1}^k\frac{R_i^2}{n_i}-3(N+1)$ ，其中 $N=∑i=1kniN=\sum_{i=1}^kn_i$ 为总样本容量， $k$ 为样本数。
根据显著性水平 $α\alpha$ 和自由度 $k - 1$ ，查找卡方分布表中对应的临界值 $χα2\chi^2_\alpha$ 。
判断检验统计量是否落在拒绝域内（即 $H>χα2H>\chi^2_\alpha$ ），如果是，则拒绝原假设；否则，接受原假设。

总结

本文介绍了多个独立样本的非参检验方法之一的Kruskal-Wallis检验的基本概念和步骤原理。

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。