dataframe的常用操作汇总
目录
1.建 1
2.读 2
3.存 2
4.阅 2
5.取 2
6.改 4
7.增 4
8.删 5
9.并 5
10.序 7
1.建
创建只有一列的数据框
df = pd.DataFrame([1, 2, 3, 4, 5], columns=[‘宽度’], index=[‘a’, ‘b’, ‘c’, ‘d’, ‘e’])
创建3行2列的数据框
df = pd.DataFrame([[1, 2], [3, 4], [5, 6]], columns=[‘分数’, ‘长度’], index=[‘a’, ‘b’, ‘c’])
对行命名
df.index.name = ‘公司’
创建3行2列的数据框
df = pd.DataFrame({‘key1’: [1, 2, 3], ‘key2’: [4, 5, 6]})
创建2行3列的数据框
df = pd.DataFrame.from_dict({‘a’: [1, 3, 5], ‘b’: [2, 4, 6]}, orient=“index”)
创建3行4列的数据框
df = pd.DataFrame(np.arange(12).reshape(3, 4), index=[1, 2, 3], columns=[‘A’, ‘B’, ‘C’, ‘D’])
对索引重命名
df = df.rename(index={‘A’: ‘万科’, ‘B’: ‘阿里’, ‘C’: ‘百度’}, columns={‘date’: ‘日期’, ‘score’: ‘分数’})
把某列设置为行索引
df = df.set_index(‘日期’)
重置行索引,把索引变成数字索引格式
df = df.reset_index()
重新建立索引
df = df.reset_index(drop=True) # 删除原来的索引,重新建立由0开始的索引
2.读
df = pd.read_excel(r’D:\codes\dataframe\wine.xls’) # 读取excel文件
df = pd.read_csv(r’D:\codes\dataframe\bigfile.csv’) # 读取csv文件
3.存
df.to_excel(r’D:\codes\dataframe\wine1.xls’, index=False) # 保存为excel文件
df.to_excel(r’D:\codes\dataframe\data_0.xlsx’, columns=[‘a’, ‘f’], index=False) # 保存a列和f列
df.to_csv(r’D:\codes\bigfile1.csv’, encoding=‘utf-8’, index=False) # 保存为csv文件
df.to_csv(r’D:\codes\bigfile1.csv’, encoding=‘gb18030’, index=False) # 保存为csv文件
4.阅
df.index # 展示数据框的行的名称
df.columns # 展示数据框的列的名称
df.values # 数控框中间的取值
df.size # 数据框值的个数
df.ndim
df.T.shape
df.head() # 查看前5行的数据
df.tail() # 查看最后5行的数据
df.shape # 查看数据库的要素
df.d