世界上并没有完美的程序,但是我们并不因此而沮丧,因为写程序就是一个不断追求完美的过程。
数据库系统 - 6
数据挖掘
功能
-
自动预测趋势和行为
-
关联分析
- 简单关联
- 时序关联
- 因果关联
-
聚类
-
概念描述
- 特征性描述
- 区别性描述
-
偏差检测
- 异常记录
常用技术
- 关联分析
- 序列模式分析
- 分类分析
- 聚类分析
流程
- 问题定义
- 建立数据挖掘库
- 分析数据
- 调整数据
- 模型化
- 评价和解释
专家
- 业务分析人员
- 数据分析人员
- 数据管理人员
NoSQL
易扩展
大数据量,高性能
灵活的数据模型
高可用
大数据
特点(4V)
-
Volume
- 数据量大
-
Variety
- 数据种类多
-
Value
- 数据价值密度低
-
Velocity
- 处理速度快
比较
-
数据量
-
GB或TB级
- PB级或以上
-
-
结构化程度
-
结构化或半结构化
- 所有类型的数据
-
-
数据分析需求
-
现有数据的分析与检测
- 深度分析
-
-
硬件平台
-
高端服务器
- 集群
-
关键技术
- 大数据采集
- 大数据预处理
- 大数据存储及管理
- 大数据分析及挖掘
- 大数据展现及应用