news 2026/4/29 19:18:55

DeepSeek总结的postgresql扩展方案文章

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
DeepSeek总结的postgresql扩展方案文章

历史在重演

原文地址:https://richyen.com/postgres/2026/02/04/history_repeats_itself.html

时隔十五年,一些解决方案依然是优秀的解决方案

引言

OpenAI 最近分享了他们如何在 ChatGPT 平台上扩展至8 亿用户的故事。过去一年,随着人工智能的蓬勃发展,他们无疑面临了一些重大的扩展挑战,而我很好奇他们是如何应对的。概括来说,他们通过以下方案解决了以下问题:

  1. 减轻主库负载(将只读查询分流到副本)
  2. 查询优化(查询调优和配置超时参数,如idle_in_transaction_session_timeout
  3. 单点故障缓解(配置热备以实现高可用)
  4. 工作负载隔离(实施了软件负载均衡方案)
  5. 连接池(部署了 pgBouncer)
  6. 缓存未命中(实现了缓存锁定机制)
  7. 扩展读副本(实施了级联复制)
  8. 资源耗尽(实施了速率限制,优化了 ORM)
  9. 模式变更导致的全表重写(执行了严格的 DML 策略)

诚然,要扩展到“每秒数百万次查询(QPS)”,他们投入了大量工作。我为他们团队实施这些方案以应对独特挑战而喝彩。👏👏👏

追忆往昔

阅读他们的文章时,我不禁想:哇,他们使用的一些解决方案和我们15 年前的没什么太大不同!十五年前,我是 Turnitin(当时叫 iParadigms)的首席 DBA。那时时代不同,社交媒体还未大规模兴起(当时 Instagram 还不存在!),我们都在本地部署,正从机械硬盘转向 SSD。当时,我们也同样面临着扩展至3000 QPS以服务美国、加拿大和英国师生数据的挑战。公司的创始人正在大力推广 Turnitin 进入中学和大学,而我们常常挣扎于只有“刚好足够”的资源来维持系统平稳运行。

有些东西(无需)改变

为了应对我们15 年前面临的挑战,我们采用了与 OpenAI 团队在2025 年设计的相似方案,即:

减轻主库负载
为了减轻主库负载,我们也实施了一个基于软件的解决方案,将只读查询发送到副本。我们用 Perl 编写了一个“复用器”(Multiplexor),监听所有传入的数据库流量(端口 5432),将包含 DML 查询的事务导向主库,而将其他查询发送到备用库。这确保了主库主要接收写流量(尽管部分读流量不可避免),并尽可能降低了 I/O。

连接池
为了确保每个数据库会话在排序、连接和聚合操作中获得最大资源,OpenAI 选择了pgBouncer作为连接池,并使用Kubernetes作为负载均衡机制。这很巧妙(我们那时没有 Kubernetes,但如果我再次担任 DBA 角色,我想我会采用它)。pgBouncer 是连接池的可靠选择;其高度可配置性和服务器会话管理能力,使 DBA 能够有效降低运维开销并保持高资源可用性。

工作负载隔离
为了隔离高优先级和低优先级的工作负载,OpenAI 实施了一个软件解决方案。他们没有具体说明,但我猜想这与他们的 Kubernetes 负载均衡配置有关。当时,我们也希望确保负载能在四个副本之间平衡,避免任何一个承受大部分读流量。为此,我们使用了haproxy,并配置它运行一些健康检查 Bash 脚本来决定流量路由。十五年过去了,haproxy 或许不再是热门词汇,但扎实的脚本和软件工程能力依然是维持系统运转的关键!

扩展读副本
OpenAI 团队详细介绍了他们如何利用级联复制作为扩展机制,扩展到“近50 个读副本”来处理其数百万 QPS。我猜测,除了给数据库带来巨大负载外,数百万 QPS 可能也让他们的网络团队在带宽消耗上有些头疼,不过这是题外话了……在 Turnitin,我们也采用了级联复制——不仅为了扩展读流量,也作为高可用性和灾难恢复的机制。通过将 WAL 文件传送到不同区域,我们能够拥有一个完全相同的数据库集群——1 个主库和 4 个备用库——而执行故障转移只需更改一个 CNAME 记录,将写流量导向新位置。之后,我们可以使用pg_rewind等工具将旧区域重新连接到新的主库区域。

结论

有趣且令人欣慰的是,15 年后,我们在 Turnitin 使用的一些相同方案,正被世界上最大的 PostgreSQL 部署之一所采用。这再次印证了一个事实:PostgreSQL 确实是“世界上最先进的开源关系型数据库”。PostgreSQL 社区人才济济,他们的专业知识深厚,代码健壮。即使是像pgBouncer这样的工具也极其可靠,足以应对超重负载、数百万 QPS 的工作场景。为 PostgreSQL 喝彩! 🐘

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/23 0:56:14

Android上的蓝牙文件传输:跨设备无缝共享

在移动工作流程和日常使用中,蓝牙文件传输仍然是跨设备数据共享的实用解决方案。虽然速度不如有线或云端传输,但其离线功能和即插即用的便捷性使其成为在安卓设备之间或Android与Windows电脑之间Android文件的可靠选择。本指南将带您了解Android系统上各…

作者头像 李华
网站建设 2026/4/24 7:33:27

市场六大专业iPaaS平台怎么选

据 IDC 预测,2026 年中国 iPaaS 市场规模将达 55.5 亿元,同比增长 28.4%,当前多数企业深陷多系统并行、数据孤岛凸显的困境。集成平台即服务(iPaaS)早已脱离单纯的系统连接工具属性,成为助力企业业务敏捷迭…

作者头像 李华
网站建设 2026/4/22 23:50:00

LangChain 1.0 工具系统:从内置工具到自定义工具开发

玄同 765 大语言模型 (LLM) 开发工程师 | 中国传媒大学 数字媒体技术(智能交互与游戏设计) CSDN 个人主页 | GitHub Follow 关于作者 深耕领域:大语言模型开发 / RAG 知识库 / AI Agent 落地 / 模型微调技术栈:Python | R…

作者头像 李华
网站建设 2026/4/23 21:46:57

防火灾智能垃圾桶设计

防火灾智能垃圾桶设计 第一章 系统设计目标与核心需求 防火灾智能垃圾桶以“火情预警、自动处置、安全可靠、便捷实用”为核心设计目标,突破传统垃圾桶无防火功能、火灾隐患处置被动的局限,适配家庭、办公、商场等人员密集场景。系统核心需求包括&…

作者头像 李华
网站建设 2026/4/28 23:12:38

在线教育互动课堂开发实战|从技术选型到高互动体验打造

着教育数字化进程的加速,在线互动课堂已成为教育行业的核心竞争力。从最初单向传输的直播课,到今天具备丰富交互功能的全场景学习空间,互动课堂经历了质的飞跃。然而,开发一个真正高效、流畅、沉浸式的在线互动课堂,仍…

作者头像 李华
网站建设 2026/4/24 21:53:02

在Daraz平台获取搜索列表数据的API接口实现

一、接口分析Daraz平台未公开官方API文档,但可通过分析网络请求获取数据接口。核心步骤如下:请求URL搜索页面的数据接口通常为:base_url "https://www.daraz.pk/api/catalog/search"关键参数params {"q": "mobile…

作者头像 李华