Sklearn 与 TensorFlow 机器学习实用指南——第七章总结

最新推荐文章于 2024-05-11 09:53:41 发布

昵称不火

最新推荐文章于 2024-05-11 09:53:41 发布

阅读量794

点赞数 3

CC 4.0 BY-SA版权

分类专栏：机器学习文章标签：机器学习

本文链接：https://blog.csdn.net/yanying1113/article/details/86322055

Sklearn 与 TensorFlow 机器学习实用指南——第七章总结

投票分类
Bagging 和 Pasting
在 sklearn 中的 Bagging 和 Pasting
Out-of-Bag 评价
随机森林
特征重要度
提升（boosting）
- Adaboost
- 梯度提升
Stacking
习题

本章主要讲解了几种集成方法，包括 bagging, boosting, stacking，和其他一些算法。参考地址
如果你合并了一组分类器的预测（像分类或者回归），你也会得到一个比单一分类器更好的预测结果。这一组分类器就叫做集成；因此，这个技术就叫做集成学习，一个集成学习算法就叫做集成方法。

投票分类

一个非常简单去创建一个更好的分类器的方法就是去整合每一个分类器的预测然后经过投票去预测分类。这种分类器就叫做硬投票分类器。
在这里插入图片描述
令人惊奇的是这种投票分类器得出的结果经常会比集成中最好的一个分类器结果更好。事实上，即使每一个分类器都是一个弱学习器（意味着它们也就比瞎猜好点），集成后仍然是一个强学习器（高准确率），只要有足够数量的弱学习者，他们就足够多样化。