问题分析过程及数据集介绍
【相关数据集以上传至‘资源’,如有其它需求请私信博主】
-
酒数据数据集:https://download.csdn.net/download/qq_53810245/85994266
-
酒数据KNN算法进行预测:https://download.csdn.net/download/qq_53810245/85994483
-
酒数据决策树预测:https://download.csdn.net/download/qq_53810245/85994500
数据集中有有两个数据集,红葡萄酒winequality-red.csv数据集和白葡萄酒winequality-white.csv数据集,在本数据集提供了有关红葡萄酒和白葡萄酒的样本信息。每种样本都由专家做了质量评级,并进行了理化指标检验,包含有如下12个特征,最后一列表示质量特征:
fixed acidity 固定酸度
volatile acidity 挥发性酸度
citric acid 柠檬酸
residual sugar 残糖
chlorides 氯化物
free sulfur dioxide 游离二氧化硫
total sulfur dioxide 总二氧化硫
density 密度
pH pH值
sulphates 硫酸盐
alcohol 酒精度
quality 质量
在数据集中可以看出,经过葡萄酒专家的评估,可以将该酒的质量分为0 到 10 之间的得分,查阅资料得知,是葡萄酒专家至少3次评估取到的中值。
由于我们的源数