python read_csv函数_Python：pandas（一）——常用、读写函数read_csv、read_excel、to_csv...

最新推荐文章于 2024-06-10 17:15:00 发布

原创

最新推荐文章于 2024-06-10 17:15:00 发布 · 2.6k 阅读

·

0

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#python read_csv函数

本文介绍了Python pandas库中的read_csv、read_excel等读取数据的函数，以及DataFrame的基本操作，如查看数据、筛选、取子集、列操作、统计函数等。此外，还讲解了如何对数据进行重组织、表格连接和时间数据处理。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

0、常用

1)读写

①从不同文本文件中读取数据的函数，都是read_xxx的形式；写函数则是to_xxx

②对前n行感兴趣，或者用于检查读进来的数据的正确性，用head(n)方法；类似的，后n行，用tail(n)——如果不写参数n，将会是n行；信息浏览可以用info()方法

③检查各列的类型，用dtypes属性

2)取子集

①这一部分的内容与numpy的切片、索引部分很类似

②可以通过shape属性查看DataFrame与Series的尺寸

③如果要查看其中的若干列，索引为这些列名的list，不能单独直接写列名

person_df[['Name','Age']]#列名的list，√

person_df['Name','Age']#直接写列名，×

④筛选特定行，类似numpy中的布尔索引

df[df['Age']>35]

df中Age大于35的行

df[func(df['Age'])]

df中对Age进行函数func后返回True的行

如果，直接用索引值df['Age']>35，则返回一个与df['Age']相同大小的Series，只是相关的值代之以True或False

3)DataFrame

DataFrame是一个2维的数据结构，每行可以存储不同的数据结构。实际上，用Excel表可以更容易理解，每列则表示一个Series(Series是另一种pandas数据结构，一个Series中的数据为同一种类型；此外，Series还有个Name属性)，同时有一个列标签；每行也有一个行标签，行标签总是数字0、1、2...。

下面我们显式的构造一个DataFrame，由于一个DataFrame有多个属性列即多个Series。所以构建时先建立一个dict，这个dict的key分别是这些Series的名，value是所有Series在该属性下的value的list，注意顺序一定要一致：

importpandasaspd

person={'Name':["Braund,Mr.OwenHarris","Allen,Mr.WilliamHenry","Bonnell,Miss.Elizabeth",],'Age':[22,35,58],'Sex':["male","male","female"],

}

person_df=pd.DataFrame(person)

person_df

NameAgeSex

0Braund,Mr.OwenHarris22male1Allen,Mr.WilliamHenry35male2Bonnell,Miss.Elizabeth58female

如果对某列感兴趣，可以通过列名(DataFrame[ 列名 ])的方式直接索引，就像查找dict某个key一样

person_df['Age']

022

1　　35

2　　58Name:Age,dtype:int64

关于DataFrame的各项属性及方法，可以看pandas(三)；Series的部分可以看pandas(四)

4)绘图

①直接对整个DataFrame用方法plot，可以得到所有数值列随Index列变化的折线图；

②对某一列用plot，可以得到该列随Index变化的折线图

③其他的散点图、箱型图，都与matplotlib的相关方法用法相似，而且可以直接从DataFrame的相关方法(见pandas(三))中找到。

④所有plot.*方法的返回值都是Matplotlib对象

5)对列的操作

①对原列的数据进行运算，得到新列的数据，并保存为新列

DataFrame['new'] = DataFrame['old'] * 2

这样就会在最右边生成一个新列'new'，其值是'old'列的两倍

②用两列进行运算，结果保存为新列

DataFram

最低0.47元/天解锁文章

200万优质内容无限畅学

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。