深入浅出数据分析—CH9直方图—R语言

本文介绍了如何使用R语言中的openxlsx包加载Excel数据,并通过直方图分析received列的不同子集。还展示了如何创建散点图来探索negotiated与加薪之间的关系,以及平均值图的应用。

CHAPTER9 直方图

数字形状

图表我从网上搜到了github下载链接

Files · master · examples / Head First Data Analysis · GitLab

第一步:加载工具包

install.packages("openxlsx")  # 安装 openxlsx 包
library(openxlsx)             # 加载 openxlsx 包

第二步:加载本地excel文件

library(openxlsx)  # 加载 openxlsx 包

# 文件路径
file_path <- "D:/学习/hfda_ch09_employees.xlsx"

# 重新加载数据框
hfda_ch09_employees <- read.xlsx(file_path)

# 确认数据框加载成功
str(hfda_ch09_employees)

展示recevied列的直方图

hist(hfda_ch09_employees$received, breaks = 50)

展示year为2007的recevied列的直方图

hist(hfda_ch09_employees$received[hfda_ch09_employees$year == 2007], breaks = 50)

展示 famale的直方图

hist(hfda_ch09_employees$received[hfda_ch09_employees$gender == "F"],breaks = 50)

 展示男性直方图

hist(hfda_ch09_employees$received[hfda_ch09_employees$gender == "M"],breaks = 50)

 展示协商过工资员工的加薪百分比

hist(hfda_ch09_employees$received[hfda_ch09_employees$negotiated == "TRUE"],breaks = 50)

 展示未协商过工资员工的加薪百分比 

hist(hfda_ch09_employees$received[hfda_ch09_employees$negotiated == "FALSE"],breaks = 50)

数据有两种变量就用散点图

展示表格数据

head(hfda_ch09_employees,n=30)

 散点图

plot(hfda_ch10_employees$requested[hfda_ch10_employees$negotiated == "TRUE"],
hfda_ch10_employees$received[hfda_ch10_employees$negotiated == "TRUE"])

平均值图是一种散点图,这种散点图显示出与X轴上的每个区间相对应的Y轴数值。这里的平均值图告诉我们提出各种加薪幅度的人的平均得到的加薪值。
平均值图比简单地求总体平均值要有效得多,正如你所知,整体平均加薪幅度为4%,但这张图却更细腻地向你显示出整体情况。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值