Power Query学习笔记-数据获取与加工

Power Query简化了企业大数据处理,支持多种数据源整合,如数据库、Excel、文本文件等。它突破Excel限制,处理大规模数据,并提供丰富的数据处理功能。通过M函数可定制计算规则,创建的查询流程可复用,提高效率。数据获取时注意选择创建连接或加载到表。横向合并(合并查询)类似VLOOKUP,需相同关键字段;纵向合并(追加查询)则是添加行记录,处理不同数量字段。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

Power Query优势

1.企业的业务都是并发关联的,如果仅用EXCEL处理,复制粘贴工作量巨大不说,还会频发人为的数据错漏。Power Q可以
提取整合多数据源数据。面上我们能叫出名字的数据源,比如各种关系型数据库、Excel文件、txt格式及cvs格式等文本文件、甚至Web页面、Hadoop的HDFS等,都在其支持范围内。

2.突破Excel表格的数据限制,可快速处理几百万甚至上千万行的数据。如果有限制也是计算机性能跟不上(8G内存的机器,数据处理量最好不要超过2G)。

3.直接通过菜单栏选项卡操作即享用丰富的数据处理分析功能。

4.可通过M函数灵活创建自定义数据处理及计算规则。
600多个M函数集,非excel一般函数能比。

5.创建好的数据处理流程可以无限次利用,大幅增加工作效率,少加班。

数据获取

导数据(即数据加载)的几个注意点:

  1. 数据加载分两种情况:仅创建连接 或 表,前者更节省空间,但默认规则是“表”。

如果已经按照创建连接的方式加载了数据,还可以通过在界面右侧的“工作簿查询”,找到表,点击右键,会出现“加载到…",即可更改。

  1. 不要××使用excel-数据选项卡下的“获取外部数据”,这个跟power query没有关系;正确的方式是从“新建查询”导入数据。

数据加工

横向合并数据(工具名叫合并查询)

类似一个excel里面Vlookup的操作。
两个概念:主表-要合并完成的表;副表-参与合并的表
合并的前提:主表和副表有相同的字段(字段名不一样没关系),主表和副表关键字段的值能够对应得上。最好没有重复值。
如果有重复值,连接后得总行数为关键字段值重复出现次数得乘积。

纵向合并数据(工具名叫追加查询)

就是给数据添加行记录的意思

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值