使用PowerBI进行篮子分析
简述
商业分析中我们通过篮子分析来发现产品之间的关联及客户的购买行为,“啤酒和尿布”的故事已经成为了难以过时的经典,业务部门渴望知道购买A产品的客户有多大概率会购买B,但前提是我们需要知道购买A产品的人有多少购买了B产品(或其他产品),即P(B|A). 而PowerBI允许我们利用DAX建立一种在产品之间的动态关系,当我们选择一个产品后,可以让页面显示客户先买了哪些产品,而后(或同时)又买了哪些产品。
方法
关于这方面的操作,我们已知的做法是Macro Russo曾经发布过的一个Blog,这上面的方法非常好,也写得很详尽全面,但问题在于没有考虑客户购买不同产品的时间先后,而且代码理解起来也有点复杂,我尝试出了一个简单粗暴的方法,其原理就是分别计算出客户购买A产品的最早时间和客户购买其他产品的最早时间,如果前者大于后者,就说明该客户是先购买了A产品才购买了其他产品,最后,我们就可以把首先购买了A产品的客户筛选出来(以及这些客户同时或在此之后又购买了哪些产品)。
过程
原数据表格如下:
由于不想让表格看起来太冗长,可视化方面用产品类别代替产品:
先购买本产品的客户数 =
VA