66、连续属性离散化与数据库关系挖掘算法研究

threejs5artist

于 2025-08-22 13:46:44 发布

点赞数

CC 4.0 BY-SA版权

分类专栏：数据挖掘与知识发现的前沿探索文章标签：连续属性离散化 MDLP Max-m

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/threejs5artist/article/details/150634074

数据挖掘与知识发现的前沿探索专栏收录该内容

67 篇文章 ¥399.00 ¥499.90

订阅专栏

超级会员免费看

连续属性离散化与数据库关系挖掘算法研究

在数据处理和机器学习领域，连续属性离散化以及数据库关系挖掘是两个重要的研究方向。本文将介绍几种熵基离散化方法的对比，以及一种用于挖掘数据库关系的算法。

熵基离散化方法对比

在学习分类规则时，连续属性的离散化是一个关键步骤。这里对比了三种熵基离散化方法：MDLP、Max - m 和 EDA - DB。

实际数据集结果

以下是几种数据集上不同离散化方法的预测准确率和平均规则数：
| 数据集 | 示例数量 | MDLP 预测准确率 | Max - m 预测准确率 | MDLP 平均规则数 | Max - m 平均规则数 |
| ---- | ---- | ---- | ---- | ---- | ---- |
| bupa | 345 | 86.78% | 22.93% | 4 | 28 |
| german | 1000 | 26.30% | 26.80% | 103 | 100 |
| glass | 214 | 23.14% | 26.23% | 31 | 30 |
| heart | 270 | 61.68% | 62.89% | 46 | 30 |
| iris | 150 | 98.33% | 92.27% | 6 | 3 |
| segment | 2310 | 98.92% | 90.28% | 29 | - |

从这些结果可以看出，不同方法在不同数据集上的表现差异较大。

MDLP 方法的问题

MDLP 方法在训练示例数量较少时停止得过早，无法检测到足够的分割点。这

了解本专栏

超级会员免费看

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。