
sql
大数据面壁者
大数据相关知识分享,框架底层原理机制,生产学习中遇到的相关问题分享,共同学习,共同进步。
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
SQL最近七天连续三天登陆用户数量
最近七天连续三天登陆用户数量分析:获取最近七天活跃的用户,并对用户活跃日期进行排序计算用户活跃日期与排名的差值对用户及差值进行分组,统计差值个数取出差值个数大于3的数据(即连续登陆三天以上的用户)对数据进行去重select mid_idfrom( select mid_id from( select mid_id,date_sub(dt,rank) date_dif from( select mid_id, dt, rank() over原创 2021-03-26 21:15:19 · 4934 阅读 · 0 评论 -
拉链表的制作案例
拉链表的制作作用:主要处理缓慢变化维的业务场景。(用户表、订单表)简洁版,比较难理解,节省了两张临时表,适用于维度表,数据量不大的情况。INSERT overwrite table dwd_dim_user_info_his --数据分两批导入到dwd_dim_user_his--第一批: old + 更新需要变化的old的数据SELECT --左表和右边关联后,右表中为NULL的是不需要更新的数据,否则且左表的end_date为9999-99-99,需要将次字段更新 old.id, o原创 2021-03-26 08:48:39 · 609 阅读 · 4 评论