彻底理解样本方差为何除以n-1

最新推荐文章于 2025-07-26 10:42:35 发布

Hearthougan

最新推荐文章于 2025-07-26 10:42:35 发布

阅读量10w+

点赞数 768

CC 4.0 BY-SA版权

分类专栏： Machine Learning 数学题文章标签：样本方差

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Hearthougan/article/details/77859173

数学题同时被 2 个专栏收录

53 篇文章

订阅专栏

Machine Learning

28 篇文章

订阅专栏

本文解释了为何样本方差的计算中分母为n-1而非n，通过定义无偏估计并推导其数学原理，揭示了样本方差如何成为总体方差的有效估计。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

设样本均值为，样本方差为，总体均值为，总体方差为，那么样本方差有如下公式：

很多人可能都会有疑问，为什么要除以n-1，而不是n，但是翻阅资料，发现很多都是交代到，如果除以n，对样本方差的估计不是无偏估计，比总体方差要小，要想是无偏估计就要调小分母，所以除以n-1，那么问题来了，为什么不是除以n-2、n-3等等。所以在这里彻底总结一下，首先交代一下无偏估计。

无偏估计

以例子来说明，假如你想知道一所大学里学生的平均身高是多少，一个大学好几万人，全部统计有点不现实，但是你可以先随机挑选100个人，统计他们的身高，然后计算出他们的平均值，记为。如果你只是把作为整体的身高平均值，误差肯定很大，因为你再随机挑选出100个人，身高平均值很可能就跟刚才计算的不同，为了使得统计结果更加精确，你需要多抽取几次，然后分别计算出他们的平均值，分别记为：然后在把这些平均值，再做平均，记为：，这样的结果肯定比只计算一次更加精确，随着重复抽取的次数增多，这个期望值会越来越接近总体均值，如果满足，这就是一个无偏估计，其中统计的样本均值也是一个随机变量，就是的一个取值。无偏估计的意义是：在多次重复下，它们的平均数接近所估计的参数真值。

介绍无偏估计的意义就是，我们计算的样本方差，希望它是总体方差的一个无偏估计，那么假如我们的样本方差是如下形式：

那么，我们根据无偏估计的定义可得：

由上式可以看出如果除以n，那么样本方差比总体方差的值偏小，那么该怎么修正，使得样本方差式总体方差的无偏估计呢？我们接着上式继续化简：

到这里得到如下式子，看到了什么？该怎修正似乎有点眉目。

如果让我们假设的样本方差乘以，即修正成如下形式，是不是可以得到样本方差是总体方差的无偏估计呢？

则：

因此修正之后的样本方差的期望是总体方差的一个无偏估计，这就是为什么分母为何要除以n-1。

评论 106

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。