pandas----索引-----(数据分析)

这篇博客深入探讨了pandas库中单层和多级索引的使用,包括loc、iloc和[]操作符的异同。通过实例分析UFO和口袋妖怪数据集,展示了如何进行数据筛选、索引设定、去重和抽样。同时,提出了多个问题,如改变列顺序、选取子集、处理缺失值和多级索引的应用场景,引导读者进一步理解和应用pandas的索引功能。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

理论部分

  • 熟练掌握多种单层索引方式及其异同
  • 掌握和理解多级索引操作
  • 熟悉常用索引设定方法及其区别
  • 掌握索引函数、去重函数和抽样函数

练习部分

  • UFO数据集分析
  • 口袋妖怪数据集分析
    一、单级索引
  1. loc方法、iloc方法、[]操作符
    最常用的索引方法可能就是这三类,其中iloc表示位置索引,loc表示标签索引,[]也具有很大的便利性,各有特点
    (a)loc方法(注意:所有在loc中使用的切片全部包含右端点!)
    ① 单行索引:
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    【练习一】 现有一份关于UFO的数据集,请解决下列问题:
    (a)在所有被观测时间超过60s的时间中,哪个形状最多? (b)对经纬度进行划分:-180°至180°以30°为一个划分,-90°至90°以18°为一个划分,请问哪个区域中报告的UFO事件数量最多?
  2. 问题
    【问题一】 如何更改列或行的顺序?如何交换奇偶行(列)的顺序?
    【问题二】 如果要选出DataFrame的某个子集,请给出尽可能多的方法实现。
    【问题三】 query函数比其他索引方法的速度更慢吗?在什么场合使用什么索引最高效?
    【问题四】 单级索引能使用Slice对象吗
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值