决策树及MATLAB函数使用

最新推荐文章于 2025-07-01 11:11:30 发布

Timmy_Y

最新推荐文章于 2025-07-01 11:11:30 发布

阅读量5.5w

点赞数 42

CC 4.0 BY-SA版权

分类专栏：机器学习算法学习机器学习笔记文章标签：决策树机器学习算法 MATLAB 数据分类

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/mingtian715/article/details/53607060

本文介绍了决策树的学习过程，包括基本流程、划分选择、信息增益与基尼系数、剪枝处理以及连续值处理。并通过MATLAB中的fitctree和fitrtree函数展示了如何创建分类和回归决策树，并进行数据分类和性能检验。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

基本流程

决策树是一种常见的机器学习方法，以二分任务为例，我们希望从给定训练数据集学得一个模型用以对新示例进行分类，顾名思义，这个分类的任务是基于树的结构来决策的，这恰是人类在面临决策问题时一种很自然的处理机制。例如下图为对西瓜分类好坏瓜的决策树。

一般一棵决策树包含一个根结点，若干内部结点和若干个叶结点，如下是决策树基本学习算法。

决策树的生成是一个递归的过程，在决策树算法中，有三种情况会导致递归返回：

（1）当前结点包含的样本全属于同一类别，无需划分。例如当前结点所有数据都是好瓜，自然不用再划分。

（2）当前属性集为空，或是所有样本在所有属性上取值相同，无法划分。例如当前样本有好瓜和坏瓜，但其颜色是相同的，自然无法在颜色属性进行划分。此时把颜色定为叶结点，类别设为包含样本数量多的类别。

（3）当前结点包含的样本集合为空，不能划分。例如对颜色（青绿、乌黑、浅白）划分，但是剩余样本中不含青绿色西瓜，因此在青绿色属性上不能继续划分。此时把青绿色定为叶结点，类别设为其父结点（颜色属性）中所含样本最多的类别。

划分选择

决策树的划分过程还是比较简单的，原则是随着划分过程不断进行，希望决策树的分支结点所包含的样本尽可能属于同一类别，即结点的“纯度”越来越高。

信息增益

采用信息熵来描述纯度，很显然信息熵越低（信息更加确定），纯度越高。

最低0.47元/天解锁文章

新学期VIP享超值加赠

评论 14

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。