数据库查询与时间网络结构分析技术研究
立即解锁
发布时间: 2025-08-23 00:43:54 阅读量: 5 订阅数: 14 


数据库与专家系统应用进展
### 数据库查询与时间网络结构分析技术研究
#### 1. 基数估计相关研究
在数据库查询中,基数估计是一个关键问题,它对于查询优化起着至关重要的作用。这里介绍一种基于图注意力网络的基数估计器(GACE),以及相关的基数估计方法和实验结果。
##### 1.1 q - error 与查询工作负载
- **q - error 定义**:q - error 用于直观地衡量估计质量,其计算公式为 \(q - error=\frac{\hat{C}}{C}\) 。当 q - error 大于 1 时表示高估,小于 1 时表示低估。箱线图的下须、下四分位数、中位数、上四分位数和上须分别表示排序后 5%、25%、50%、75%、95% 的 q - error。
- **查询工作负载的连接分布**:不同查询工作负载的连接数量分布不同,如下表所示:
| 工作负载 | 连接数 0 | 连接数 1 | 连接数 2 | 连接数 3 | 连接数 4 | 总体 |
| --- | --- | --- | --- | --- | --- | --- |
| Train | 26818 | 29888 | 43294 | 0 | 0 | 10000 |
| Synthetic | 1636 | 1407 | 1957 | 0 | 0 | 5000 |
| Scale | 100 | 100 | 100 | 100 | 100 | 500 |
| JOB - light | 0 | 3 | 32 | 23 | 12 | 70 |
##### 1.2 不同工作负载下的 q - errormax
在不同的查询工作负载下,比较了 PostgreSQL、MSCN、new - enc MSCN、E2E 和 GACE 的 q - errormax,具体数据如下:
- **Synthetic 工作负载**
| 方法 | 中位数 | 90th | 95th | 99th | 最大值 | 平均值 |
| --- | --- | --- | --- | --- | --- | --- |
| PostgreSQL | 1.69 | 9.57 | 23.9 | 465 | 373901 | 154 |
| MSCN | 1.19 | 3.32 | 6.84 | 30.51 | 1322 | 2.89 |
| New - Enc MSCN | 1.18 | 3.29 | 6.73 | 31 | 1200.1 | 2.85 |
| E2E | 1.18 | 3.19 | 6.05 | 24.5 | 323 | 2.81 |
| GACE | 1.18 | 3.28 | 6.8 | 29.61 | 1008.6 | 2.83 |
在 Synthetic 工作负载下,new - enc MSCN 在除 99th 外的所有百分位数上略优于 MSCN,GACE 表现与 new - enc MSCN 相似,且两者均不如 E2E,但总体估计基数都接近真实基数,改进空间有限。
- **Scale 工作负载**
| 方法 | 中位数 | 90th | 95th | 99th | 最大值 | 平均值 |
| --- | --- | --- | --- | --- | --- | --- |
| PostgreSQL | 2.59 | 200 | 540 | 1816 | 233863 | 568 |
| MSCN | 1.42 | 37.4 | 140 | 793 | 3666 | 35.1 |
| New - Enc MSCN | 1.35 | 37.38 | 108.50 | 503.57 | 2799.54 | 26.41 |
| E2E | 1.42 | 37.3 | 125 | 345 | 1813 | 26.3 |
| GACE | 1.35 | 24.93 | 58.71 | 253.09 | 2813.74 | 19.19 |
在 Scale 工作负载下,new - enc MSCN 在所有百分位数上略优于 MSCN,GACE 的改进相当可观,除最大百分位数外,在所有情况下都比 E2E 好 5% - 68%。
- **JOB - light 工作负载**
| 方法 | 中位数 | 90th | 95th | 99th | 最大值 | 平均值 |
| --- | --- | --- | --- | --- | --- | --- |
| PostgreSQL | 7.93 | 164 | 1104 | 2912 | 3477 | 174 |
| MSCN | 3.82 | 78.4 | 362 | 927 | 1110 | 57.9 |
| New - Enc MSCN | 2.44 | 17.00 | 41.24 | 135.64 | 269.31 | 11.59 |
| E2E | 3.51 | 48.6 | 139 | 244 | 272 | 24.3 |
| GACE | 2.11 | 10.92 | 19.12 | 103.13 | 219.59 | 8.16 |
在 JOB - light 工作负载下,主要包含 2 - 4 个连接的查询,MSCN 和 E2E 的性能不佳。添加更多动态特征后,new - enc MSCN 在所有情况下都
0
0
复制全文
相关推荐










