简单聊聊从贝叶斯公式到朴素贝叶斯模型

%KT%

于 2025-03-20 15:33:06 发布

阅读量310

点赞数 5

CC 4.0 BY-SA版权

分类专栏：机器学习文章标签：概率论机器学习算法

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/a287100886/article/details/146397347

机器学习专栏收录该内容

5 篇文章

订阅专栏

1、贝叶斯公式：

贝叶斯公式部分可参考文章：一个模型记忆全概率公式和贝叶斯公式_全概率公式和贝叶斯公式图解-CSDN博客

2、朴素贝叶斯模型：

对于如下贝叶斯公式：

在机器学习的具体场景中，可以有这样的设定（拿西瓜书中根据特征判断好瓜坏瓜的例子来说）： $A_{i}$ 即各种标签，如“好瓜”和“坏瓜”，B即各种特征，如“色泽”，“硬度”等。

在使用朴素贝叶斯模型时，我们要做的任务是：根据特征判断这是好瓜还是坏瓜。

假设现在的特征只用两个，即：色泽和硬度。那么模型需要进行判断的就是下面两个概率之间的大小：

如果P(好瓜|色泽，硬度)>P(坏瓜|色泽，硬度)，那么模型就认为这是好瓜，反之则是坏瓜。

P(好瓜|色泽，硬度)称为后验概率，该后验概率是不能根据数据集直接计算得到的，但注意到等式的右边的式子，他们的分母相同，所以可以将后验概率的比较转化为：

P(色泽，硬度|好瓜)×P(好瓜)和P(色泽，硬度|坏瓜)×P(坏瓜)之间的比较。

而这个式子中，P(色泽，硬度|好瓜)和P(好瓜)分别称为类条件概率（也可称为似然性）和先验概率，他们是可以根据数据集进行求得的。这也就是用朴素贝叶斯模型进行概率类别预测的核心。

3、朴素贝叶斯模型的重要假设

对于类条件概率P(色泽，硬度|好瓜)，当特征数比较少时，根据概率论中的链式法则，是比较好计算的，但是当特征变多（这也是机器学习中更常见的情形），那么这个概率计算就会非常复杂。所以，朴素贝叶斯模型有一个非常重要的假设，就是假设特征之间是相互独立的，那么这个类条件概率公式就可以转化为：

推广到更多特征，那么存在公式：

这里的c就是类别，x就是特征。

这个重要的假设，也是朴素贝叶斯模型称作“朴素”的原因。

博客等级

码龄3年

48
原创

526
点赞

413
收藏

288
粉丝

关注

私信

热门文章

分类专栏

展开全部收起

上一篇：: 决策树（DT算法）

下一篇：: 简单聊聊PyQt中的多线程编程

最新评论

手势识别-Yolov5模型-自制数据集训练
CSDN-Ada助手: 不知道 Python入门技能树是否可以帮到你：https://edu.csdn.net/skill/python?utm_source=AI_act_python
手势识别-Yolov5模型-自制数据集训练
CSDN-Ada助手: 推荐 Python入门技能树：https://edu.csdn.net/skill/python?utm_source=AI_act_python
NLP：利用jieba库，基于TF-IDF算法的关键词提取
weixin_55053752: 博主，这上面的TEXT只有一个，如果是针对多个文档的关键词提取，能否实现多个文档整体的关键词提取，而非单独生成每个文档的TOPN关键词及其权重。比如我研究多个政策文本的话，抽取其中的关键词及其权重，这种情况下可能导出的关键词是每个政策文本单独生成的，如果有10个政策文本，提取前20的关键词，运行结果会变成，每个政策文本分别提取20个关键词，但实际上我想要的是这10个政策文本整体上排名前20的关键词，请问这种如何实现呢
深度学习中的Channel，通道数是什么？
CSDN-Ada助手: 不知道 Python入门技能树是否可以帮到你：https://edu.csdn.net/skill/python?utm_source=AI_act_python
C:循环链表解决约瑟夫环问题
CSDN-Ada助手: 恭喜作者在博客中分享了关于循环链表解决约瑟夫环问题的内容，这是一个很有趣的主题。希望作者能继续保持创作的热情，分享更多关于算法和数据结构的知识。下一步可以考虑分享一些实际应用场景下的算法解决方案，让读者更好地理解算法的实际应用价值。期待作者的下一篇博客！

大家在看

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。