轨迹数据仓库模型与表格数据可视化分析
立即解锁
发布时间: 2025-08-23 02:02:44 阅读量: 1 订阅数: 12 

# 轨迹数据仓库模型与表格数据可视化分析
## 1. 轨迹数据仓库模型
### 1.1 轨迹频率监测与树结构更新
在轨迹数据处理中,为了监测轨迹频率,会在树结构的每个节点额外存储轨迹频率信息。若对于给定的 P 值有多个见证(witness),则会存储每个见证的频率。初始树是为第一个窗口 W1 构建的,记为 BT。随着流中出现新的轨迹,会持续更新该树。具体更新步骤如下:
1. 对于每个新进入的轨迹 Ti ∈ NEW,通过对 BT 进行深度搜索,查找其编码值 E(Ti) 所属的节点 N。
2. 若节点 N 存在,说明 Ti 是频繁的,更新其频率。使用 updateFrequency 函数更新 Ti 的见证 Wi 的频率(同一 P 值可能有多个见证)。
3. 若轨迹在树中不存在,则插入相应节点并标注其时间戳。
4. 随着流的流动,若需要释放内存,则删除较旧的节点(即时间戳较早的节点)。
### 1.2 仓库架构
轨迹数据仓库采用雪花模式,以更好地处理轨迹的空间特征。该架构包含空间和时间维度,用于描述对象的位置和移动信息。以下是该架构的主要特点:
- **无损分区**:轨迹分区步骤是无损操作,因为关注的是聚合信息,所以基于精确点的轨迹表示是无效的,而采用的质数编码方案能有效保留细节信息。
- **事实表与维度表**:除了维度表的键,事实表还包含一组表示聚合信息的度量。常见的度量包括不同轨迹的数量(Intersections)、平均行驶距离(Distance)、平均时间间隔持续时间(Duration)等。
### 1.3 构建轨迹立方体(TRAC)
#### 1.3.1 TRAC 结构
TRAC 由三个表组成:
1. **Items 表**:存储移动对象的信息。
2. **Collection 表**:存储穿越被分析区域的轨迹信息。
3. **Time 表**:存储时间信息。
每个表的维度都有相关的概念层次结构,从低抽象级别到高抽象级别。最低级别对应数据流中跟踪单个对象的单个区域,最高级别通常是 ALL,表示该维度的任何值。
#### 1.3.2 部分物化策略
为了高效回答不同抽象级别的查询,会预计算一些不同概念层次的 TRAC。由于计算所有可能的泛化是非常昂贵的操作,因此采用部分物化策略。具体做法是计算一组用户感兴趣的最低级别 TRAC,以及一小部分经常请求的高级结构,这些高级结构可用于快速计算未物化的 TRAC。
#### 1.3.3 合并立方体
随着流的流动,会重新计算基本的 TRAC 并合并较旧的 TRAC,以节省空间并保持高信息水平。合并时在较高信息级别进行,以避免信息丢失或错误值计算。例如,若要合并的两个立方体的空间层次结构底层分别是街区和城市,合并后的立方体空间层次结构底层将是城市。
#### 1.3.4 算法实现
以下是构建 TRAC 和更新度量的算法:
```plaintext
Method: BuildT RAC
Input:
a trajectory tree BT encoding a trajectory window;
a set of measures m to be computed;
Output:
a trajectory cuboid T RAC;
Vars:
a tree node N;
a set of dimensions dim at a specified granularity level;
Method:
1: for each N ∈BT
2:
for each dimi
3:
if N ̸= null
4:
for
```
0
0
复制全文
相关推荐










