亚马逊Redshift数据仓库监控指南
立即解锁
发布时间: 2025-08-31 01:06:14 阅读量: 7 订阅数: 11 AIGC 

### 亚马逊 Redshift 数据仓库监控指南
#### 1. 无服务器模式监控与管理
在无服务器模式下,控制台监控指标分布在控制台的各个部分。主无服务器仪表板展示了账户中所有命名空间或工作组的查询和数据库指标详情。通过该视图,可将查询工作负载与所使用的 RPU 容量关联起来,了解一天中哪个时段利用率更高,以及是否需要增加无服务器的基础 RPU。还能查看所有失败查询,以进一步分析失败原因。
以下是无服务器主仪表板中的监控指标详情:
| 指标 | 详情 |
| --- | --- |
| 查询指标 | 运行和排队的查询、已使用的 RPU 容量、已完成和失败的查询(跨时间线)、查询数量(跨时间线)、已使用的 RPU 容量 |
若要监控特定命名空间或工作组的工作负载,可从主仪表板中选择特定命名空间,方法有两种:点击链接或过滤命名空间,这样就能显示该特定命名空间的查询和数据库资源指标。
当选择“查询和数据库监控”时,可选择无服务器工作组来分析查询和负载工作负载,有“查询历史”和“数据库性能”两个监控选项。由于无服务器会自动扩展并按需添加 RPU 容量,直至达到配置的最大 RPU 值,因此无需像在预配置集群中那样监控或管理工作负载或工作负载并发。
在“查询历史”中,可使用“查询运行时间”图表查看哪些查询在同一时间段运行,并选择一个查询查看更多查询执行细节,还能分析和查看查询的完成状态、持续时间和 SQL 语句。此外,还有额外的过滤选项,可选择时间范围、查询类型、使用的 SQL 命令类型,或选择特定用户或数据库。
还可进一步深入查询 ID,查看查询 SQL、查询计划和相关指标的详细信息。查询计划基于重写后的查询,相关指标包括已使用的 RPU 容量和活动数据库连接数。查询计划屏幕会显示查询的详细计划以及各个流和段的运行时间,还能看到输入和输出行,以确定瓶颈所在。相关指标会显示过去 10 小时内以 RPU 为单位的总容量使用情况和活动数据库连接数,帮助将容量使用情况与该时间段内的活动数据库连接关联起来。
以下是无服务器查询和数据库监控的详细指标:
| 查询/数据库 | 查询/资源 | 指标 | 详情 |
| --- | --- | --- | --- |
| 查询历史 | | 查询列表 | 使用此图表查看哪些查询在同一时间段运行,选择一个查询查看更多查询执行细节 |
| | | 查询和负载 | 查询和负载统计信息,包括开始时间、持续时间 |
| | 资源指标 | 查询运行时间 | 查看更多查询执行细节 |
| | | 已使用的 RPU 容量 | 以 RPU 为单位的总容量 |
| | | 数据库连接 | 活动数据库连接数 |
| 数据库性能 | | 每秒完成的查询数 | 每秒完成的平均查询数 |
| | | 查询持续时间 | 完成一个查询的平均时间 |
| | | 数据库连接 | 活动数据库连接数 |
| | | 运行中的查询 | 给定时间的运行中查询总数 |
| | | 排队的查询 | 给定时间的排队查询总数 |
| | | 已使用的 RPU 容量 | 以 RPU 为单位的总容量 |
| | | 查询运行时间细分 | 按查询类型划分的查询运行总时间 |
资源监控方面,在无服务器控制台选择“资源监控”时,会看到两个图表。第一个图表显示 Redshift RPU 的总容量,x 轴为时间线;第二个图表显示 Redshift 无服务器按时间段的累积使用情况。RPU 容量仅在需要处理工作负载时进行调配,工作负载的实际计算使用量下降后,容量会降至零,且其变化跟踪计算使用模式。同样,RPU 容量领先于使用图表,因为只有当查询工作负载开始进入无服务器端点时,RPU 容量才会自动扩展,这表明 RPU 容量会自动扩展以满足传入的工作负载。持续较大的累积使用量可能表明可以为无服务器设置更高的初始 RPU,以便更快地执行工作负载,同时成本不变。
无服务器资源监控的指标详情如下:
| 指标 | 详情 |
| --- | --- |
| 已使用的 RPU 容量 | 以 RPU 为单位的总容量 |
| 计算使用量 | 所选时间范围内 Redshift 无服务器按时间段的累积使用量 |
#### 2. 使用控制台监控预配置数据仓库
亚马逊 Redshift 预配置数据仓库的主仪表板显示所有集群的指标,可选择特定的预配置数据仓库进行监控。能在各种指标之间切换,查看查询、数据库连接、磁盘空间和 CPU 利用率。
预配置集群的性能数据可分为两类:
- 数据仓库性能和资源利用率指标
- 查询和数据摄入性能指标
通过数据仓库性能指标,可监控系统资源并分析是否需要进行扩展或缩减。通过查询和摄入指标,可分析特定工作负载在给定资源下的执行情况。
主仪表板中的指标可总结如下:
| 指标 | 详情 |
| --- | --- |
| 集群指标 | 查询数量、数据库连接、已使用的磁盘空间、CPU 利用率 |
| 查询概述 | 特定时间的查询工作负载(短、中、长) |
数据仓
0
0
复制全文
相关推荐









