打印 pyspark.sql.dataframe.DataFrame 有哪些列

原创于 2023-09-20 14:07:15 发布 · 754 阅读

0 ·

CC 4.0 BY-SA版权

文章标签：

#pandas

本文介绍了如何在PySpark中使用`columns`属性打印DataFrame的列名，通过创建SparkSession和DataFrame实例，展示了获取和打印列名的具体步骤。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

在 PySpark 中，要打印 pyspark.sql.dataframe.DataFrame 的列，可以使用 columns 属性。以下是一个示例代码：

from pyspark.sql import SparkSession

# 创建 SparkSession
spark = SparkSession.builder.getOrCreate()

# 假设您的 DataFrame 名称为 df
df = spark.createDataFrame([(1, 'John', 25), (2, 'Alice', 30), (3, 'Bob', 35)], ['id', 'name', 'age'])

# 打印 DataFrame 的列
columns = df.columns
print(columns)

运行上述代码将打印 DataFrame 的列名：