/*
Navicat MySQL Data Transfer
Source Server : hadoop01
Source Server Version : 50730
Source Host : hadoop01:3306
Source Database : scrm
Target Server Type : MYSQL
Target Server Version : 50730
File Encoding : 65001
Date: 2020-09-04 21:52:02
*/
SET FOREIGN_KEY_CHECKS=0;
-- ----------------------------
-- Table structure for `customer_clue`
-- ----------------------------
DROP TABLE IF EXISTS `customer_clue`;
CREATE TABLE `customer_clue` (
`id` int(11) NOT NULL AUTO_INCREMENT,
`create_date_time` datetime NOT NULL DEFAULT CURRENT_TIMESTAMP COMMENT '创建时间',
`update_date_time` timestamp NOT NULL DEFAULT CURRENT_TIMESTAMP ON UPDATE CURRENT_TIMESTAMP COMMENT '最后更新时间',
`deleted` bit(1) NOT NULL DEFAULT b'0' COMMENT '是否被删除(禁用)',
`customer_id` int(11) DEFAULT NULL COMMENT '客户id',
`customer_relationship_id` int(11) DEFAULT NULL COMMENT '客户关系id',
`session_id` varchar(48) COLLATE utf8_bin DEFAULT '' COMMENT '七陌会话id',
`sid` varchar(48) COLLATE utf8_bin DEFAULT '' COMMENT '访客id',
`status` varchar(16) COLLATE utf8_bin DEFAULT '' COMMENT '状态(undeal待领取 deal 已领取 finish 已关闭 changePeer 已流转)',
`user` varchar(16) COLLATE utf8_bin DEFAULT '' COMMENT '所属坐席',
`create_time` datetime DEFAULT NULL COMMENT '七陌创建时间',
`platform` varchar(16) COLLATE utf8_bin DEFAULT '' COMMENT '平台来源 (pc-网站咨询|wap-wap咨询|sdk-app咨询|weixin-微信咨询)',
`s_name` varchar(32) COLLATE utf8_bin DEFAULT '' COMMENT '用户名称',
`seo_source` varchar(255) COLLATE utf8_bin DEFAULT '' COMMENT '搜索来源',
`seo_keywords` varchar(255) COLLATE utf8_bin DEFAULT '' COMMENT '关键字',
`ip` varchar(48) COLLATE utf8_bin DEFAULT '' COMMENT 'IP地址',
`referrer` text COLLATE utf8_bin COMMENT '上级来源页面',
`from_url` text COLLATE utf8_bin COMMENT '会话来源页面',
`landing_page_url` text COLLATE utf8_bin COMMENT '访客着陆页面',
`url_title` varchar(1024) COLLATE utf8_bin DEFAULT '' COMMENT '咨询页面title',
`to_peer` varchar(255) COLLATE utf8_bin DEFAULT '' COMMENT '所属技能组',
`manual_time` datetime DEFAULT NULL COMMENT '人工开始时间',
`begin_time` datetime DEFAULT NULL COMMENT '坐席领取时间 ',
`reply_msg_count` int(11) DEFAULT '0' COMMENT '客服回复消息数',
`total_msg_count` int(11) DEFAULT '0' COMMENT '消息总数',
`msg_count` int(11) DEFAULT '0' COMMENT '客户发送消息数',
`comment` varchar(1024) COLLATE utf8_bin DEFAULT '' COMMENT '备注',
`finish_reason` varchar(255) COLLATE utf8_bin DEFAULT '' COMMENT '结束类型',
`finish_user` varchar(32) COLLATE utf8_bin DEFAULT '' COMMENT '结束坐席',
`end_time` datetime DEFAULT NULL COMMENT '会话结束时间',
`platform_description` varchar(255) COLLATE utf8_bin DEFAULT '' COMMENT '客户平台信息',
`browser_name` varchar(255) COLLATE utf8_bin DEFAULT '' COMMENT '浏览器名称',
`os_info` varchar(255) COLLATE utf8_bin DEFAULT '' COMMENT '系统名称',
`area` varchar(255) COLLATE utf8_bin DEFAULT NULL COMMENT '区域',
`country` varchar(16) COLLATE utf8_bin DEFAULT '' COMMENT '所在国家',
`province` varchar(16) COLLATE utf8_bin DEFAULT '' COMMENT '省',
`city` varchar(255) COLLATE utf8_bin DEFAULT '' COMMENT '城市',
`creator` int(11) DEFAULT '0' COMMENT '创建人',
`name` varchar(64) COLLATE utf8_bin DEFAULT '' COMMENT '客户姓名',
`idcard` varchar(24) COLLATE utf8_bin DEFAULT '' COMMENT '身份证号',
`phone` varchar(24) COLLATE utf8_bin DEFAULT '' COMMENT '手机号',
`itcast_school_id` int(11) DEFAULT NULL COMMENT '校区Id',
`itcast_school` varchar(128) COLLATE utf8_bin DEFAULT '' COMMENT '校区',
`itcast_subject_id` int(11) DEFAULT NULL COMMENT '学科Id',
`itcast_subject` varchar(128) COLLATE utf8_bin DEFAULT '' COMMENT '学科',
`wechat` varchar(32) COLLATE utf8_bin DEFAULT '' COMMENT '微信',
`qq` varchar(32) COLLATE utf8_bin DEFAULT '' COMMENT 'qq号',
`email` varchar(56) COLLATE utf8_bin DEFAULT '' COMMENT '邮箱',
`gender` varchar(8) COLLATE utf8_bin DEFAULT 'MAN' COMMENT '性别',
`level` varchar(8) COLLATE utf8_bin DEFAULT NULL COMMENT '客户级别',
`origin_type` varchar(32) COLLATE utf8_bin DEFAULT '' COMMENT '数据来源渠道',
`information_way` varchar(32) COLLATE utf8_bin DEFAULT NULL COMMENT '资讯方式',
`working_years` date DEFAULT NULL COMMENT '开始工作时间',
`technical_directions` varchar(255) COLLATE utf8_bin DEFAULT '' COMMENT '技术方向',
`customer_state` varchar(32) COLLATE utf8_bin DEFAULT '' COMMENT '当前客户状态',
`valid` bit(1) DEFAULT b'0' COMMENT '该线索是否是网资有效线索',
`anticipat_signup_date` date DEFAULT NULL COMMENT '预计报名时间',
`clue_state` varchar(32) COLLATE utf8_bin DEFAULT 'NOT_SUBMIT' COMMENT '线索状态',
`scrm_department_id` int(11) DEFAULT NULL COMMENT 'SCRM内部部门id',
`superior_url` text COLLATE utf8_bin COMMENT '诸葛获取上级页面URL',
`superior_source` varchar(1024) COLLATE utf8_bin DEFAULT NULL COMMENT '诸葛获取上级页面URL标题',
`landing_url` text COLLATE utf8_bin COMMENT '诸葛获取着陆页面URL',
`landing_source` varchar(1024) COLLATE utf8_bin DEFAULT NULL COMMENT '诸葛获取着陆页面URL来源',
`info_url` text COLLATE utf8_bin COMMENT '诸葛获取留咨页URL',
`info_source` varchar(255) COLLATE utf8_bin DEFAULT NULL COMMENT '诸葛获取留咨页URL标题',
`origin_channel` varchar(32) COLLATE utf8_bin DEFAULT '' COMMENT '投放渠道',
`course_id` int(32) DEFAULT NULL,
`course_name` varchar(255) COLLATE utf8_bin DEFAULT NULL,
`zhuge_session_id` varchar(500) COLLATE utf8_bin DEFAULT NULL,
`is_repeat` int(4) NOT NULL DEFAULT '0' COMMENT '是否重复线索(手机号维度) 0:正常 1:重复',
`tenant` int(11) NOT NULL DEFAULT '0' COMMENT '租户id',
`activity_id` varchar(16) COLLATE utf8_bin DEFAULT NULL COMMENT '活动id',
`activity_name` varchar(64) COLLATE utf8_bin DEFAULT NULL COMMENT '活动名称',
`follow_type` int(4) DEFAULT '0' COMMENT '分配类型,0-自动分配,1-手动分配,2-自动转移,3-手动单个转移,4-手动批量转移,5-公海领取',
`shunt_mode_id` int(11) DEFAULT NULL COMMENT '匹配到的技能组id',
`shunt_employee_group_id` int(11) DEFAULT NULL COMMENT '所属分流员工组',
PRIMARY KEY (`id`),
KEY `customer_id` (`customer_id`),
KEY `customer_relationship_id` (`customer_relationship_id`),
KEY `idcard` (`idcard`),
KEY `index_creator` (`creator`),
KEY `index_date_time` (`create_date_time`),
KEY `phone` (`phone`),
KEY `session_id` (`session_id`),
CONSTRAINT `customer_clue_ibfk_1` FOREIGN KEY (`customer_id`) REFERENCES `customer` (`id`),
CONSTRAINT `customer_clue_ibfk_2` FOREIGN KEY (`customer_relationship_id`) REFERENCES `customer_relationship` (`id`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8 COLLATE=utf8_bin;
-- ----------------------------
-- Records of customer_clue
-- ----------------------------
INSERT INTO `customer_clue` VALUES ('1', '2019-11-05 00:24:42', '2020-01-03 18:32:43', '', '2', '2', null, null, null, null, null, null, null, null, null, null, null, null, null, null, null, null, null, null, null, null, null, null, null, null, null, null, null, null, null, null, null, '451', '**', '', '186****0002', '1', '北京', null, null, null, '271****75', '', 'WOMEN', 'A', 'NETSERVICE', null, null, null, null, '', null, 'INVALID_PUBLIC_OLD_CLUE', '53', null, null, null, null, null, null, '', null, null, null, '0', '1', null, null, '0', null, null);
INSERT INTO `customer_clue` VALUES ('2', '2019-11-05 00:24:42', '2020-01-03 18:32:43', '', '4', '4', null, null, null, null, null, null, null, null, null, null, null, null, null, null, null, null, null, null, null, n
hadoop学习-基于Hive的教育平台数据仓库分析案例(二)意向用户模块sql文件
需积分: 0 128 浏览量
更新于2024-05-07
1
收藏 6.93MB ZIP 举报
在本教程中,我们将深入探讨如何使用Hadoop和Hive构建一个教育平台的数据仓库,特别是针对意向用户模块的SQL分析。Hadoop是一个分布式文件系统,它允许存储和处理大规模数据集,而Hive则是在Hadoop之上构建的一个数据仓库工具,提供了一种SQL-like的语言,使得非编程背景的用户也能轻松地进行大数据分析。
我们来看看"意向用户模块"。在教育领域,意向用户通常指的是对课程或服务有兴趣但尚未注册或购买的潜在客户。分析这部分用户的数据可以帮助教育平台了解市场需求、优化产品推广策略,并预测未来收入潜力。在这个案例中,我们可能会关注用户的浏览行为、搜索关键词、停留时间等指标,以挖掘用户的兴趣和需求。
接下来,我们提到的"scrm数据"可能指的是Social CRM(社会化的客户关系管理)数据。这类数据包括用户在社交媒体上的活动、互动和反馈,如点赞、评论、分享等。通过分析这些数据,我们可以更深入地理解用户的行为模式,识别出具有高转化潜力的意向用户,并制定针对性的营销策略。
在Hadoop生态系统中,数据导入通常分为几个步骤:
1. **数据准备**:确保数据已经清洗和格式化,符合Hive的数据模型。这可能涉及CSV、JSON或其他结构化数据格式的转换。
2. **创建Hive表**:根据数据结构定义Hive表,包括列名、数据类型以及分区字段(如果适用)。例如,对于意向用户数据,可能有`user_id`, `activity_type`, `timestamp`, `search_keywords`等字段。
3. **加载数据**:使用Hive的`LOAD DATA`命令或者`HDFS`命令将数据从本地或HDFS的临时位置移动到Hive表对应的目录下。
4. **数据验证**:执行查询来检查数据是否正确加载,确保数据完整性和一致性。
5. **SQL分析**:使用HiveQL编写SQL查询来执行数据挖掘和分析。例如,找出最常搜索的关键词、分析用户在特定时间段内的活跃度等。
在这个教育平台案例中,我们可能需要执行以下类型的SQL查询:
- **聚合分析**:计算各关键词的搜索频率,找出最受欢迎的课程。
- **关联规则分析**:找出用户搜索关键词与最终购买课程之间的关联性,以优化推荐系统。
- **时间序列分析**:分析用户活动随时间的变化趋势,识别流量高峰和低谷。
- **用户画像**:通过用户行为数据构建用户画像,细分用户群体,为精准营销提供依据。
K12教育是指从幼儿园到十二年级的教育阶段,这个标签表明我们的案例可能特别关注这个年龄段的用户。因此,数据分析可能需要考虑该年龄段的特殊需求和行为模式。
总结起来,本案例是关于如何利用Hadoop和Hive对教育平台中的意向用户数据进行深度分析,通过SQL查询揭示用户行为模式,优化产品策略,提升业务效果。通过对scrm数据的分析,我们可以更好地理解用户需求,实现更有效的社会化CRM管理。

卓_尔_不_凡
- 粉丝: 424
最新资源
- MATLAB数据处理技术在光学领域屈光度计算中的应用与实现
- 网络营销的策略组合.pptx
- 海康威视嵌入式产品介绍.pptx
- 计算机网络试题及解答(最终).doc
- 高等数学第五节极限运算法则.ppt
- 浅析网络经济对财务管理的影响.doc
- 人工智能的发展历程.pdf
- 宁波大学通信工程专业培养方案及教学计划.doc
- 用matlab绘制logistic模型图.ppt
- 住房城乡建设项目管理办法.pdf
- (源码)基于Arduino的遥控车系统.zip
- 基于MATLAB的均匀与非均匀应变光纤光栅仿真分析系统 精选版
- 网络管理与维护案例教程第5章-网络安全管理.ppt
- 网络语言的特点及对青少年语言运用的影响和规范.doc
- 算法讲稿3动态规划.pptx
- 高中信息技术编制计算机程序解决问题学案.docx