DataFrame 表示一个矩形数据表,包含一个有序的命名列集合,每个列可以是不同的值类型(数字、字符串、布尔值等)。DataFrame 同时具有行索引和列索引;它可以被认为是一个 Series 的字典,所有 Series 都共享同一个索引。
注意:虽然 DataFrame 在物理上是二维的,但我们可以使用分层索引以表格格式表示更高维的数据。
构造 DataFrame 的方法有很多种,最常见的一种是从等长列表或 NumPy 数组的字典中构造。
from pandas import Series, DataFrame
data = {"state": ["Ohio", "Ohio", "Ohio", "Nevada", "Nevada", "Nevada"],
"year": [2000, 2001, 2002, 2001, 2002, 2003],
"pop": [1.5, 1.7, 3.6, 2.4, 2.9, 3.2]}
frame = DataFrame(data)
print(frame)
输出:
state year pop
0 Ohio 2000 1.5
1 Ohio 2001 1.7
2 Ohio &