文章目录 一、分组聚合 二、数据清洗 1、数据清洗---重复值 1>重复值的检测 2>重复值处理 2、数据清洗---缺失值 1>缺失值检测 借助info形式 isnull形式 notnull形式 2>缺失值的处理 删除法 填充法 插值法 3、数据清洗---异常值 一、分组聚合 二、数据清洗 数据预处理 1.数据集成 1>左右合并 2>上下合并 3>主键合并 4>重叠合并 2.数据清洗 1>重复值的处理 2>空值(缺失值)的处理 3>异常值的处理 3.数据规约 1>数据量的规约 2>数据标准化 4.数据变换 1>非数值转换为数值---->哑变量转换 2>连续数据 离散化---->离散化处理