(一)集中趋势
集中趋势:平均值,中位数,分位数,众数
import pandas as pd
df=pd.read_csv('./lianjia.csv',encoding='gbk')
df.head()
# 数据结构(DataFrame 和 Series数据操作一般来说是共用的,形式一样)
# 前DataFframe 后Series
type(df)
type(df['house_rental_area'])
求平均值
df.mean()
type(df.mean())
df['house_latitude'].mean()
中位数
df.median()
df['house_latitude'].median()
# 分位数
df.quantile(q=0.25)
df['house_latitude'].quantile(q=0.25)
众数
df.mode()
df['house_latitude'].mode()
返回其他数据结构
df['house_rental_price'].mode()
type(df['house_rental_price'].mode()
(二)离中趋势
离中趋势:标准差,方差,偏态系数,峰态系数
偏态系数(由正负取值决定分态) 越大越尖,越小越平稳
峰态系数以正态分布为0作为标准
#标准差
df.std()
df['house_latitude'].std()
# 方差
df.var()
df['house_latitude'].var()
# 求和
df.sum()
d