python 判断两列有重复数据_Pandas统计重复的列里面的值方法

这篇博客介绍了如何利用Pandas库在Python中检查和处理数据框中重复的列值,通过`duplicated()`函数及其参数`keep`来识别和筛选重复项,并对比了不同设置的效果。此外,还提到了非Pandas环境下使用numpy处理数组中重复值的方法。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

pandas

代码如下:

import pandas as pd

import numpy as np

salaries = pd.DataFrame({

'name': ['BOSS', 'Lilei', 'Lilei', 'Han', 'BOSS', 'BOSS', 'Han', 'BOSS'],

'Year': [2016, 2016, 2016, 2016, 2017, 2017, 2017, 2017],

'Salary': [1, 2, 3, 4, 5, 6, 7, 8],

'Bonus': [2, 2, 2, 2, 3, 4, 5, 6]

})

print(salaries)

print(salaries['Bonus'].duplicated(keep='first'))

print(salaries[salaries['Bonus'].duplicated(keep='first')].index)

print(salaries[salaries['Bonus'].duplicated(keep='first')])

print(salaries['Bonus'].duplicated(keep='last'))

print(salaries[salaries['Bonus'].duplicated(keep='last')].index)

print(salaries[salaries['Bonus'].duplicated(keep='last')])

输出如下:

Bonus Salary Year name

0 2 1 2016 BOSS

1 2 2 2016 Lilei

2 2 3 2016 Lilei

3 2 4 2016 Han

4 3 5 2017 BOSS

5 4 6

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值