读取parquet列式存储格式文件创建DataFrame
1、数据准备
使用spark安装包下的
/opt/bigdata/spark/examples/src/main/resources/users.parquet文件
2、读取数据
val parquetDF=spark.read.parquet("file:///export/servers/spark/examples/src/main/resources/users.parquet")
3、使用DataFrame的函数操作
parquetDF.show
parquetDF.printSchema
喜欢就点赞评论+关注吧
感谢阅读,希望能帮助到大家,谢谢大家的支持!