数据挖掘中的概念差异发现、缺失值估计与预测规则发现
在数据挖掘领域,概念差异发现、缺失值估计以及预测规则发现是几个重要的研究方向。下面将详细介绍相关的研究方法和实验结果。
概念差异发现
为了提高从案例中发现人们之间概念差异的能力,研究人员提出了一种利用具有不同结构的多个决策树的方法。通过对之前使用 ID3 算法的系统和采用该方法的系统进行实验,在运动诊断案例中的结果表明,与之前的方法相比,发现性能得到了提升。
以下是使用 ID3 算法和遗传算法(GA)的实验结果:
| 方法 | 类别 | 试验次数 | 首次发现 | 第二次发现 | 第三次发现 | 发现概率 |
| ---- | ---- | ---- | ---- | ---- | ---- | ---- |
| ID3 | C1 | 20 | 20 | 0 | 0 | 100% |
| ID3 | C2 | 18 | 0 | 0 | 90% |
| ID3 | C1 | 30 | 17 | 1 | 0 | 60% |
| ID3 | A2 | 5 | 3 | 7 | 50% |
| ID3 | C1 | 30 | 30 | 0 | 0 | 100% |
| ID3 | V2 | 52 | 0 | 0 | 87% |
| ID3 | C2 | 30 | 22 | 0 | 1 | 77% |
| ID3 | V1 | 24 | 4 | 0 | 93% |
| ID3 | A1 | 30 | 12 | 13 | 3 | 93% |
| ID3 | A2 | 6 | 3 | 7 | 53% |
| ID3