91人参与 • 2026-05-14 • MsSqlserver

在现代企业级应用架构中,postgresql 作为一款功能强大、开源且高度可扩展的关系型数据库,正被越来越多的 java 应用所采用。然而,默认配置并不适用于生产环境。许多开发者在将 postgresql 部署到生产系统后,常常遇到性能瓶颈、连接耗尽、查询缓慢等问题,其根源往往在于未对关键参数进行合理调优。
本文将深入探讨 postgresql 在生产环境中的核心配置参数,从内存管理、连接控制、wal(write-ahead logging)机制、查询规划等多个维度,提供一套系统性的调优指南。同时,我们将结合 java 应用的实际使用场景,通过代码示例展示如何与优化后的数据库协同工作,并辅以 mermaid 图表 直观呈现关键机制,帮助你构建高性能、高可用的 postgresql 数据库服务。
💡 提示:本文假设你已具备 postgresql 基础知识和 linux 系统管理经验。所有建议均基于 postgresql 12+ 版本,但大部分原则适用于 10 及以上版本。
postgresql 的内存管理是性能调优的核心。它不像某些数据库那样使用统一的共享内存池,而是将内存划分为多个独立的区域,每个区域服务于特定目的。理解这些区域的作用,是合理分配系统资源的前提。
共享内存由所有数据库进程共享,主要包括:
每个后端进程(backend process)拥有自己的私有内存,包括:
postgresql 严重依赖操作系统的文件系统缓存。即使 shared_buffers 设置得很大,os 缓存仍然扮演着关键角色,因为 postgresql 使用 posix_fadvise() 来提示 os 如何缓存数据。
📌 关键理念:postgresql 的设计哲学是“信任操作系统”。因此,不要将所有内存都分配给
shared_buffers,而应为 os 缓存留出足够空间。
我们可以通过以下 mermaid 图表直观理解 postgresql 的内存结构:
作用:postgresql 用于缓存数据页的内存区域。当查询需要读取数据时,首先检查 shared_buffers,若未命中,则从 os 缓存或磁盘读取。
默认值:通常为 128mb(取决于编译时设置)。
调优建议:
shared_buffers 会导致检查点(checkpoint)期间 i/o 峰值过高。shared_buffers 超过 4–8gb 后收益递减,因为 os 缓存效率更高。示例:
# 32gb 内存的服务器 shared_buffers = 8gb
🔗 更多关于
shared_buffers的讨论可参考 postgresql 官方文档 - shared_buffers
作用:单个操作(如排序、哈希连接、位图堆扫描)可使用的最大内存量。注意:不是每个连接的总内存,而是每个操作!一个复杂查询可能同时使用多个 work_mem 区域。
默认值:4mb。
风险:如果并发连接数高且每个连接执行多个排序操作,总内存消耗 = 并发连接数 × 每查询操作数 × work_mem,极易导致 oom。
调优建议:
work_mem = (可用内存 - shared_buffers) / (max_connections × 2)shared_buffers=8gb,max_connections=100,则:(32 - 8) gb = 24gb ≈ 24576 mb 24576 / (100 × 2) ≈ 122 mb
work_mem = 64mb(保守起见,留有余量)。java 示例:在 spring boot 应用中,避免在应用层进行大数据集排序,而应利用数据库的 order by + 合理索引。若必须排序大量数据,确保 work_mem 足够:
// 错误做法:在 java 中加载 10 万条记录再排序
list<user> users = userrepository.findall();
users.sort(comparator.comparing(user::getscore));
// 正确做法:让数据库排序
pageable pageable = pagerequest.of(0, 1000, sort.by("score").descending());
list<user> topusers = userrepository.findall(pageable).getcontent();
作用:vacuum、create index、alter table add foreign key 等维护操作使用的最大内存。
默认值:64mb。
调优建议:
autovacuum 工作进程也使用此内存,但最多使用 autovacuum_max_workers 个实例。示例:
maintenance_work_mem = 2gb
作用:仅用于查询规划器,告诉优化器 os 和 postgresql 共享缓冲区总共能缓存多少数据。不影响实际内存分配!
默认值:128mb。
调优建议:
24gb。影响:值越大,规划器越倾向于使用索引扫描(因为认为索引页很可能在缓存中)。
effective_cache_size = 24gb
作用:允许的最大并发连接数。
默认值:100。
问题:每个连接消耗约 10mb 内存(含栈空间),高并发下内存压力巨大。
最佳实践:
max_connections!max_connections = 100~300,配合连接池处理数千应用连接。java 示例(hikaricp 配置):
@configuration
public class datasourceconfig {
@bean
public datasource datasource() {
hikariconfig config = new hikariconfig();
config.setjdbcurl("jdbc:postgresql://db-host:5432/mydb");
config.setusername("user");
config.setpassword("pass");
// 关键:连接池大小远小于 max_connections
config.setmaximumpoolsize(20); // 应用最多 20 个连接
config.setminimumidle(5);
config.setconnectiontimeout(30000);
config.setidletimeout(600000);
config.setmaxlifetime(1800000); // 30 分钟
return new hikaridatasource(config);
}
}
📌 建议:postgresql 的
max_connections设为 100,hikaricp 的maximumpoolsize设为 20,即可支撑高并发 web 应用。
作用:为超级用户保留的连接数,防止普通连接占满后 dba 无法登录。
建议:设为 3。
superuser_reserved_connections = 3
wal(write-ahead logging)是 postgresql 实现 acid 的核心机制。合理配置 wal 相关参数,可大幅提升写入性能并减少 i/o 抖动。
作用:wal 日志在写入磁盘前的内存缓冲区。
默认值:-1(表示为 shared_buffers 的 1/32,最小 64kb,最大 64mb)。
调优建议:
-1 即可。16mb。wal_buffers = 16mb
检查点(checkpoint)是将脏页(dirty pages)从内存刷入磁盘的过程。不当的检查点配置会导致 i/o 峰谷明显,影响性能。
作用:两次检查点之间的最大时间间隔。
默认值:5min。
建议:增加至 15min 或 30min,减少检查点频率。
checkpoint_timeout = 30min
作用:检查点完成的目标时间占 checkpoint_timeout 的比例。值越高,i/o 越平滑。
默认值:0.5。
建议:设为 0.9,使检查点在接近超时前完成,避免突发 i/o。
checkpoint_completion_target = 0.9
作用:控制 wal 文件的最大和最小数量(单位:wal segment,通常 16mb)。
默认值:max_wal_size = 1gb(64 segments),min_wal_size = 80mb。
调优建议:
max_wal_size 可减少检查点触发频率。max_wal_size = 8gb(512 segments)。max_wal_size = 8gb min_wal_size = 2gb
💡 检查点工作原理:postgresql 会在
max_wal_size达到时触发“紧急检查点”,因此增大该值可避免频繁紧急检查点。
我们用 mermaid 展示检查点与 wal 的关系:
作用:规划器估算随机读取和顺序读取一页数据的相对成本。
默认值:
seq_page_cost = 1.0random_page_cost = 4.0问题:该默认值假设使用机械硬盘(hdd)。在 ssd 环境下,随机读取几乎与顺序读取一样快。
调优建议:
random_page_cost = 1.1random_page_cost = 2.0~2.5# ssd 服务器 random_page_cost = 1.1 seq_page_cost = 1.0
作用:告知规划器底层存储支持的并发 i/o 请求数。仅在 linux 上使用 posix_fadvise 时有效。
默认值:1(hdd),ssd 应设为更高值。
建议:
200300effective_io_concurrency = 200
重要性:postgresql 使用 mvcc,更新/删除会产生“死元组”(dead tuples),必须通过 vacuum 清理,否则表会膨胀,性能下降。
关键参数:
# 启用 autovacuum(必须!) autovacuum = on # 触发 vacuum 的阈值:基础值 + 表行数 × 比例 autovacuum_vacuum_threshold = 50 autovacuum_vacuum_scale_factor = 0.05 # 默认 5% # 对于大表,降低 scale_factor 避免延迟清理 autovacuum_vacuum_scale_factor = 0.02 # 同理,analyze 更新统计信息 autovacuum_analyze_scale_factor = 0.02 # 增加工作进程数(默认 3) autovacuum_max_workers = 6 # 提高维护内存 maintenance_work_mem = 2gb
java 应用建议:
@transactional 方法),这会阻止 autovacuum 清理死元组。-- 查看膨胀率
select schemaname, tablename,
pg_size_pretty(real_size) as real_size,
pg_size_pretty(extra_size) as extra_size,
bloat_pct
from (
select schemaname, tablename,
pg_total_relation_size(schemaname||'.'||tablename) as real_size,
(pg_total_relation_size(schemaname||'.'||tablename) -
pg_relation_size(schemaname||'.'||tablename)) as extra_size,
round(100 * (pg_total_relation_size(schemaname||'.'||tablename) -
pg_relation_size(schemaname||'.'||tablename)) /
pg_total_relation_size(schemaname||'.'||tablename)) as bloat_pct
from pg_tables
where schemaname not in ('information_schema', 'pg_catalog')
) t
where bloat_pct > 30
order by bloat_pct desc;
生产环境应开启必要日志,便于排查问题:
# 记录慢查询(超过 1 秒) log_min_duration_statement = 1000 # 记录锁等待 log_lock_waits = on # 记录检查点、自动清理 log_checkpoints = on log_autovacuum_min_duration = 0 # 日志格式 log_line_prefix = '%t [%p]: [%l-1] user=%u,db=%d,app=%a,client=%h '
作用:跟踪 sql 语句的执行统计(调用次数、总时间、平均时间等)。
启用步骤:
-- 1. 创建扩展 create extension pg_stat_statements; -- 2. 配置 postgresql.conf shared_preload_libraries = 'pg_stat_statements' pg_stat_statements.track = all
java 应用集成示例:定期采集慢 sql 并告警
@repository
public class slowquerymonitor {
@autowired
private jdbctemplate jdbctemplate;
public list<slowquery> getslowqueries() {
string sql = """
select query, calls, total_exec_time, mean_exec_time,
rows, 100.0 * shared_blks_hit / nullif(shared_blks_hit + shared_blks_read, 0) as hit_percent
from pg_stat_statements
where mean_exec_time > 100 -- 平均超过 100ms
order by total_exec_time desc
limit 10;
""";
return jdbctemplate.query(sql, (rs, rownum) -> new slowqery(
rs.getstring("query"),
rs.getlong("calls"),
rs.getdouble("mean_exec_time"),
rs.getdouble("hit_percent")
));
}
}
postgresql 9.6+ 支持并行扫描、聚合、连接。
关键参数:
# 最大并行工作进程数(每个查询) max_parallel_workers_per_gather = 4 # 系统总并行工作进程上限 max_parallel_workers = 8 # 启用并行顺序扫描 enable_seqscan = on # 通常保持 on
适用场景:olap、大数据量聚合。
java 注意:确保连接池不阻塞并行(hikaricp 无问题)。
postgresql 11+ 引入 jit,可加速表达式计算。
默认:jit = off(因多数 oltp 场景收益小,反而增加开销)。
建议:仅在复杂计算型查询(如科学计算)中开启。
jit = off # 大多数生产环境保持关闭
虽然本文聚焦性能,但生产环境不可忽视:
ssl = onpg_hba.conf 使用 scram-sha-256pg_basebackup + wal 归档 + pg_probackup 或 barman# 内存 shared_buffers = 8gb effective_cache_size = 24gb work_mem = 64mb maintenance_work_mem = 2gb # 连接 max_connections = 100 superuser_reserved_connections = 3 # wal & checkpoint wal_buffers = 16mb checkpoint_timeout = 30min checkpoint_completion_target = 0.9 max_wal_size = 8gb min_wal_size = 2gb # 查询规划 random_page_cost = 1.1 effective_io_concurrency = 200 # autovacuum autovacuum = on autovacuum_vacuum_scale_factor = 0.02 autovacuum_analyze_scale_factor = 0.02 autovacuum_max_workers = 6 # 日志 log_min_duration_statement = 1000 log_lock_waits = on log_checkpoints = on log_autovacuum_min_duration = 0 log_line_prefix = '%t [%p]: [%l-1] user=%u,db=%d,app=%a,client=%h ' # 并行 max_parallel_workers_per_gather = 2 max_parallel_workers = 4 # 其他 listen_addresses = '*' port = 5432 timezone = 'asia/shanghai'
调优不是一次性工作。建议:
explain (analyze, buffers) 慢查询。pgbench 模拟负载。java 应用健康检查示例:
@restcontroller
public class healthcontroller {
@autowired
private jdbctemplate jdbctemplate;
@getmapping("/health/db")
public responseentity<map<string, object>> dbhealth() {
try {
long count = jdbctemplate.queryforobject("select 1", long.class);
if (count != null) {
return responseentity.ok(map.of("status", "up", "database", "postgresql"));
}
} catch (exception e) {
return responseentity.status(503).body(map.of("status", "down", "error", e.getmessage()));
}
return responseentity.status(503).build();
}
}
postgresql 的强大不仅在于其功能丰富,更在于其高度可配置性。通过科学地调整 shared_buffers、work_mem、wal 参数、autovacuum 策略等核心配置,结合 java 应用的连接池优化与 sql 编写规范,你完全可以在生产环境中构建一个稳定、高效、可扩展的数据库服务。
记住:没有放之四海而皆准的配置。每一次调优都应基于你的硬件、业务负载和监控数据。从小处着手,持续观察,逐步迭代,才是生产环境调优的正确之道。
🚀 最后提醒:在修改
postgresql.conf后,部分参数需重启生效(如shared_buffers),部分可重载生效(如work_mem)。使用pg_reload_conf()或select pg_reload_conf();可重载动态参数。
到此这篇关于postgresql生产环境的配置优化之核心参数调优大全的文章就介绍到这了,更多相关postgresql生产环境核心参数调优内容请搜索代码网以前的文章或继续浏览下面的相关文章希望大家以后多多支持代码网!
您想发表意见!!点此发布评论
版权声明:本文内容由互联网用户贡献,该文观点仅代表作者本人。本站仅提供信息存储服务,不拥有所有权,不承担相关法律责任。 如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 2386932994@qq.com 举报,一经查实将立刻删除。
发表评论