pd 修改列名_Python-修改列名、缺失值探索以及替代vlookup的join()使用方法

本文介绍了如何在Python的Pandas库中修改数据框的列名,包括批量修改的方法。同时,探讨了缺失值的两种探索方式,并详细阐述了join()函数的使用,作为替代Vlookup功能的一种实用技巧,展示了如何将结果从一张表格合并到另一张表格。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

71438da6332322e848fa8a3c00b3d091.png

修改列名:

方法一:

data = data.rename(columns={'user_id':'用户ID', 'item_id':'商品ID', 'behavior_type':'行为类型', 'user_geohash':'行为发生时用户的位置', 'item_category':'商品类别',
       'time':'时间'})

如果需要修改的同字段的表有多张:

方法二:

colname= ['id','上次评分','项目数','月平均工时','工龄','是否有工伤','福利等级','五年内是否有升职','部门','工资水平','满意度']
name = {i:j for i,j in zip(data_train.columns,colname)}
data_train = data_train.rename(columns=name)
data_test= data_test.rename(columns=name)

1cdf08612d565c65c2eb47e6c766b982.png

缺失值探索:

方法一:

data_train.isnull().any()

b0ebe50112082667957c385818c8cfe9.png
data_train.isnull().all()

c50dc8c7fbc48338659783551752fdc0.png

方法二:

pip install ProfitDataFrame
import ProfitDataFrame as pdf
pdf1 = pdf.Profitdataframe(data_train)
info = pdf1.q_info()
info

8f21980052da8d5f17e5c2d0dfa4682c.png

join函数使用方法:

现在手上有这样两张表格,要将结果并入到第一张表该咋整呢?

06ef882405e082a791169418ada0f3b4.png

89aff7c7044f9f2b51c025762d5cfed7.png
import pandas as pd
data1=pd.read_csv(r'F:标题更改测试集.csv')
data2=pd.read_csv(r'F:预测.csv')
data1=data1.set_index('id').join(data2.set_index('id'))
data1.to_csv(r'F:测试集+满意度.csv')

a53afb253d8ad57e7b7e858d18b0bd99.png

ok

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值