学习笔记(03):Python数据清洗实战-Pandas常用数据结构series和方法
pandas常用数据结构series和方法 通过pandas.series来创建series数据结构 pandas.series(data,index,dtype,name) data可以为列表,array或者dict index表示索引,必须与数据同长度,name代表对象的名称 建立series的三种方式 1.通过列表来建: import numpy as np import pandas as pd series1 = pd.Series([2,8,3.01,4.8,9.7,8.0]) 添加index和name试一试 series2 = pd.Series([1.3,3.5,9,3. 在Python的数据处理领域,Pandas库是不可或缺的一部分,它提供了高效的数据结构和强大的数据分析工具。在数据清洗过程中,Pandas的Series数据结构尤其重要。Series是Pandas的基础数据结构之一,类似于一维数组,但拥有自己的索引系统,使得数据操作更加灵活。 我们可以通过以下三种方式创建Series: 1. **通过列表创建**: 基本语法是`pd.Series(data, index, dtype, name)`。例如: ```python import numpy as np import pandas as pd series1 = pd.Series([2,8,3.01,4.8,9.7,8.0]) ``` 如果要添加索引和名称,可以这样做: ```python series2 = pd.Series([1.3,3.5,9,3.5,5], index=['a','b','c','d','e'], name='这是一个序列') ``` 2. **通过一维数组创建**: 例如,如果我们有一个numpy数组`s1 = np.random.rand(4)`,我们可以这样创建Series: ```python series3 = pd.Series(s1, index=['ha','ou','im','ta']) ``` 3. **通过字典创建**: 字典的键将作为索引,值将作为数据: ```python series4 = pd.Series({'北京':2.5,'上海':3.01,'广东':5.8,'山西':7.8}) ``` 访问Series的数据有多种方式。如果通过索引名称(即字典中的键)访问,如`series4['上海']`,可以直接获取对应值。对于范围访问,Series支持左闭右开的切片操作,如`series4[1:3]`,返回的是'上海'到'广东'的值。而如果想要左闭右闭的索引访问,可以使用`series4['上海':'山西']`,这会包含'上海'和'山西'两个元素。 此外,Series提供了`.values`属性来获取数据的numpy数组形式,例如`series4.values`,以及`.index`属性来获取索引列表,例如`series4.index`。 在实际的数据清洗工作中,Series的这些特性使得我们可以方便地进行数据筛选、替换、合并等操作。例如,可以使用条件查询筛选出满足特定条件的值,或者使用`.fillna()`方法填充缺失值,使用`.replace()`方法替换特定值。同时,Series与Pandas的另一核心数据结构DataFrame相结合,能进行更复杂的数据处理任务,如列操作、数据聚合、分组统计等。 理解并熟练掌握Pandas的Series数据结构及其方法,对于Python数据清洗和分析来说至关重要。通过不断地实践和学习,我们可以更加高效地处理各种数据问题,提升数据处理能力。































- 粉丝: 3
我的内容管理 展开
我的资源 快来上传第一个资源
我的收益
登录查看自己的收益我的积分 登录查看自己的积分
我的C币 登录后查看C币余额
我的收藏
我的下载
下载帮助


最新资源
- 网站兼职编辑分类搜索授权合作协议书.doc
- 北京航空航天大学计算机组成原理课程设计项目
- 掌握TypeScript核心技能
- 基于 PHP+MySQL+Apache+Bootstrap 的医院管理系统设计与实现
- 华中科技大学计算机科学与技术学院组成原理课程设计+MIPS五段流水CPU+团队项目
- 软工二课程设计:互联网酒店管理系统
- 《Linux 系统及程序设计》选修课课程资源仓库
- 中国海洋大学(OUC)计算机网络课程设计与大型实验项目
- 句子迷APP项目-基于MVP架构的Android应用-集成Okhttp与Retrofit网络框架及RxJava响应式编程-实现句子分享与收藏功能的社区平台-包含今日热门推荐与作品分.zip
- bebopze-tdx-23724-1756630462616.zip
- drfccv-mcp-server-12306-16804-1756630390865.zip
- 基于 Struts2 实现购物车的增删查改功能设计
- 基于树莓派ZREO BCM2835的简易树莓派操作系统 计算机科学与技术 操作系统课程设计
- 基于Python和PySide6框架开发的人工智能网络安全审计工具-集成DeepSeek-Ollama-Siliconflow等先进AI模型-提供智能代码审计-Webshell检测.zip
- KrisFeng00-LibararyManager-38272-1756661594532.zip
- 基于射频识别(RFID)技术的大楼人员定位系统课程设计 基于射频识别技术实现的大楼内部人员定位系统课程设计 面向大楼人员定位需求的射频识别(RFID)技术应用课程设计 依托射频识别技术构建的大楼人员实



评论0