1.箱形图显示六个数据:
组成部分 | 含义 |
---|---|
最小值(Min) | 除异常值之外的数据中的最小值 |
下四分位数(Q1) | 25% 的数据小于该值(第1四分位数) |
中位数(Q2) | 数据的中间值,50% 的数据小于该值 |
上四分位数(Q3) | 75% 的数据小于该值(第3四分位数) |
最大值(Max) | 除异常值之外的数据中的最大值 |
异常值(Outliers) | 超过上下须线范围的数据点,通常用点或星号表示 |
1.异常值的计算
箱型图中使用的是1.5倍IQR法则(Tukey’s Rule)来判断异常值:
下界(下限) = Q1 - 1.5 × IQR
上界(上限) = Q3 + 1.5 × IQR
凡是:
小于下界的值,被认为是下异常值
大于上界的值,被认为是上异常值
IQR的计算:
IQR = Q3 - Q1