本文示例:根据箱型图、直方图的代码和数据的条件查询方法,画出航空公司男性和女性用户的年龄分布箱型图和直方图。
目录
图形概念
1.箱型图
箱型图是一种用作显示一组数据分散情况资料的统计图,它主要用于反映原始数据分布的特征,还可以进行多组数据分布特征的比 较。箱线图的绘制方法是:先找出一组数据的上边缘、下边缘、中位数和两个四分位数;然后, 连接两个四分位数画出箱体;再将上边缘和下边缘与箱体相连接,中位数在箱体中间。
25%分位数(下四分位数):序列中有25%的数据小于这个数
中位数(50%分位数):序列中有50%的数据小于这个数
75%分位数(上四分位数):序列中有75%的数据小于这个数
最大值:序列100%的数据小于这个数
最小值:序列没有数据小于这个数
2.直方图
直方图(Histogram),又称质量分布图,是一种统计报告图,由一系列高度不等的纵向条纹或线段表示数据分布的情况。 一般用横轴表示数据类型,纵轴表示分布情况。直方图容易和柱形图搞混淆,外观上没有区别,但是直方图一般指用来描述数据的分布的柱形图。
直方图的常见作用有以下三点:
(1)显示质量波动的状态;
(2)较直观地传递有关过程质量状况的信息;
(3)通过研究质量波动状况之后,就能掌握过程的状况,从而确定在什么地方集中力量进行质量改进工作。
步骤:
1、导入相关库
import pandas as pd
from pyecharts import options as opts
from pyecharts.charts import Boxplot
from pyecharts.