PostgreSQL性能监控与故障排查实用指南

### PostgreSQL性能监控与故障排查实用指南 #### 1. 查看pg_stat_statements视图在高可用性且处理大量查询流量的数据库中，记录每个查询并非理想做法。数据库管理员（DBAs）通常通过在`postgresql.conf`文件中设置`log_min_duration_statement`为合理的毫秒数，仅记录慢查询。然而，快速查询仍难以被察觉，频繁执行的查询可能将数据源缓存于内存中，虽不太可能产生I/O，但数据库可能每秒执行数千次低效或冗余查询，除了服务器负载升高外，我们难以察觉。不过，借助`pg_stat_statements`，我们可以解决这个问题。 ##### 1.1 准备工作激活并使用此扩展需要修改`postgresql.conf`配置文件并重启PostgreSQL。需确保拥有PostgreSQL超级用户权限以及能重启服务的用户权限，如`postgres`或`root`系统用户。 ##### 1.2 操作步骤 - 安装`pg_stat_statements`模块： 1. 修改`postgresql.conf`中的`shared_preload_libraries`行，添加该模块： ```plaintext shared_preload_libraries = 'pg_stat_statements' ``` 2. 若使用PostgreSQL 9.1或更早版本，在`postgresql.conf`文件中添加： ```plaintext custom_variable_classes = 'pg_stat_statements' ``` 3. 使用类似以下命令重启PostgreSQL： ```plaintext pg_ctl -D /db/pgdata restart ``` 4. 以超级用户身份登录到任何需要访问`pg_stat_statements`的数据库，并执行以下SQL语句： ```sql CREATE EXTENSION pg_stat_statements; ``` - 为通用使用准备`pg_stat_statements`： 1. 以数据库超级用户身份执行以下SQL语句创建函数： ```sql CREATE OR REPLACE FUNCTION pg_stat_statements() RETURNS SETOF pg_stat_statements AS $$ SELECT * FROM pg_stat_statements; $$ LANGUAGE sql SECURITY DEFINER; ``` 2. 执行以下SQL语句保护创建的函数： ```sql REVOKE ALL ON FUNCTION pg_stat_statements() FROM PUBLIC; ``` 3. 使用以下SQL语句创建专门用于监控的用户： ```sql CREATE USER db_mon WITH PASSWORD 'somepass'; ``` 4. 使用以下SQL语句授予监控用户使用函数的权限： ```sql GRANT EXECUTE ON FUNCTION pg_stat_statements() TO db_mon; ``` - 以`db_mon`用户身份连接到PostgreSQL，并执行以下SQL语句查看`pg_stat_statements`的内容： ```sql SELECT * FROM pg_stat_statements(); ``` ##### 1.3 工作原理首先，需将`pg_stat_statements`添加到`shared_preload_libraries`配置设置中，因为部分PostgreSQL模块需如此操作才能使用。若使用的是早于PostgreSQL 9.2的版本，`custom_variable_classes`设置可用于后续进一步配置该模块，而当前版本会自动处理。由于`pg_stat_statements`模块依赖激活外部库，所以重启PostgreSQL才能使其生效。加载模块后，需在需要使用该模块的数据库中安装访问它的必要函数，通过执行`CREATE EXTENSION`语句将这些函数注册到当前数据库。后续步骤旨在让非超级用户也能使用`pg_stat_statements`模块。创建一个以定义者身份运行的函数，普通用户可借此查看`pg_stat_statements`的内容。为防止普通用户执行具有高权限的函数，撤销公共上下文的所有访问权限。若没有专门用于监控数据库活动的用户，则创建一个并授予其执行`pg_stat_statements()`的权限。较新版本的PostgreSQL似乎每次发布都会为该视图添加更多字段，许多新字段专注于与磁盘计时和脏块相关的I/O，用于更高级的使用场景。常见的列如下： | 列名 | 描述 | | ------------ | -------------------------------------------------------------------- | | query | 显示被跟踪查询的前1024个字符 | | calls | 包含SQL语句的总执行次数 | | total_time | 提供处理查询所花费的总时间（以毫秒为单位） | | rows | 列出查询返回的总行数 | 通过这些列，我们可以进行诸多调查。例如，用`total_time`除以`calls`可得到平均执行速度；按`calls`列对数据排序可发现执行频率远高于大多数查询的异常值。 ##### 1.4 额外功能 - **重置统计信息**：`pg_stat_statements`视图中存储的统计信息会一直累积，直到被强制重置。若不想监控检查之间的值增量，可作为超级用户执行以下SQL语句重置模块状态并清除已收集的数据： ```sql SELECT pg_stat_statements_reset(); ``` - **捕获更多查询**：默认情况下，`pg_stat_statements`模块仅跟踪数据库操作期间遇到的前1000个查询。对于PostgreSQL 9.1以上版本通常足够，新版本在将查询包含到视图之前会移除SQL变量和常量，提供更好的聚合效果。但较旧版本或查询构造变化较大的数据库可能需要增加该数量。可在`postgresql.conf`文件中添加： ```plaintext pg_stat_statements.max = 10000 ``` 然后再次重启PostgreSQL，之后该模块将跟踪10000个查询，可根据情况尝试其他值。 #### 2. 使用strace进行调试有时，借助内核本身是真正观察服务器进程的唯一方法，这种数据对于PostgreSQL活动的故障排查或研究非常有价值。Linux的`strace`实用工具可为服务器上运行的任何进程或服务提供详细的系统跟踪数据。用于PostgreSQL时，可针对数据库本身或其用于维护的任何后台进程，还能调试或检查任何客户端连接。 ##### 2.1 准备工作使用`strace`存在一定限制，因它能高度访问进程信息，只有root级用户才能检查应用程序的活动，需确保具备此权限。同时，需打开一个PostgreSQL连接

最低0.47元/天解锁专栏

赠100次下载

继续阅读点击查看下一篇

400次会员资源下载次数

300万+ 优质博客文章

1000万+ 优质下载资源

1000万+ 优质文库回答

复制全文

PostgreSQL性能监控与故障排查实用指南

相关推荐

专栏目录

PostgreSQL性能监控与故障排查实用指南

相关推荐

PostgreSQL数据库管理与高级主题详解

5-PostgreSQL监控实战.pdf

PostgreSQL9.6.0-CN中文指南 PG DBA必备

PostgreSQL性能监控与故障排查：动态追踪与性能分析的实战技巧

PostgreSQL性能优化与故障排查：PgBouncer、pgpool及常用工具使用指南

PostgreSQL故障排查与监控指南

PostgreSQL故障排除与监控指南

【性能调优秘籍】：PostgreSQL性能监控与调优基础

PostgreSQL详细安装配置与集群管理指南

PostgreSQL 9.0.4 Linux版下载与安装指南

项目功能记录：zip解压上传文件到oss服务器接口实现

SAR ADC逐次逼近型ADC全流程详解：从理论分析到电路设计及性能仿真测试

专栏目录

最新推荐

智能城市中的交通管理与道路问题报告

硬核谓词与视觉密码学中的随机性研究

MicroPython项目资源与社区分享指南

请你提供书中第28章的具体内容，以便我按照要求为你创作博客。

嵌入式系统应用映射与优化全解析

大新闻媒体数据的情感分析

物联网技术与应用：从基础到实践的全面解读

排序创建与聚合技术解析

物联网智能植物监测与雾计算技术研究

下一代网络中滞后信令负载控制建模与SIP定位算法解析