一次大规模 PDF 导出系统的工程复盘-开发者社区

——从“能跑”到“稳定可控”的完整决策过程
背景
业务中存在一类历史记录数据（若干字段 + 图片），需要支持批量导出为 PDF，用于归档和离线查看。
单页约包含 3 条记录，每条记录包含图片资源。

在极端情况下，导出任务可能涉及：

数千页内容
上万张图片
国内 / 海外多云部署
弱网与不稳定网络环境
这类任务不属于实时请求链路，但对系统稳定性要求极高。

一、问题定义：这不是“导出”，而是“批处理系统”
在需求分析阶段，我们没有将其简单视为“生成 PDF”，而是明确了它的工程属性：

✅ 高 IO 消耗（大量图片下载、文件读写）
✅ 高 CPU 消耗（无头浏览器渲染、HTML → PDF）
✅ 高内存消耗（图片解码、页面上下文）
✅ 异步、长时间任务
✅ 失败不可影响主业务
因此，首要目标不是“速度最快”，而是：

在极端数据量和不稳定环境下，保证导出成功率和系统隔离性。

二、架构选择：为什么使用函数计算（Serverless）
我们评估了三种方案：

前端直接渲染并导出 PDF（否决）
大数据量下浏览器内存占用极高
页面卡死甚至崩溃
严重影响用户体验
结论：重计算任务不应放在客户端执行。
放入核心后端服务（风险较高）
属于资源消耗不可控的任务
在并发或异常情况下，可能拖垮核心服务
导出功能并非主业务链路
结论：不应与核心服务共享资源池。
使用函数计算进行任务隔离（最终选择）
独立计算环境
异步执行
资源可配置
即使失败也不影响主业务
结论：该任务更适合放入 Serverless / 外部计算资源中。

三、初始方案设计
整体流程如下：

前端创建导出任务
将结构化数据打包为 JSON（图片仅传 URL）
通过消息机制触发函数计算
Node.js 函数计算启动无头浏览

Qwen3.5-9B-GGUF与STM32CubeMX结合：嵌入式项目代码注释生成

Qwen3.5-9B-GGUF与STM32CubeMX结合：嵌入式项目代码注释生成 1. 嵌入式开发的痛点与解决方案在嵌入式开发领域，STM32CubeMX已经成为工程师们快速生成初始化代码的标配工具。但随之而来的一个普遍问题是：自动生成的代码往往缺乏详细注释&…

李华

如何构建一个基于YOLOv8的中餐菜品检测系统食品检测菜品中餐检测数据集 3000张智慧食堂带标注 voc yolo

如何构建一个基于YOLOv8的中餐菜品检测系统食品检测菜品中餐检测数据集 3000张智慧食堂带标注 voc yolo分类名: (图片张数， 标注个数) fried_ dumplings: (302， 320) water_ spinach: (738， 747) rice:(1208，1296) triangle_ h…

李华

【花雕学编程】Arduino BLDC 之毫米波雷达+光流复合导引机器人

基于 Arduino 平台结合 BLDC（无刷直流电机）的毫米波雷达光流复合导引机器人，代表了移动机器人感知技术从“单一维度”向“多模态融合”的跨越。该系统巧妙地利用了毫米波雷达的“穿透性”与“测速能力”，以及光流传感器的“高精…

李华

如何在5分钟内掌握实时屏幕翻译：Translumo终极指南

如何在5分钟内掌握实时屏幕翻译：Translumo终极指南【免费下载链接】Translumo Advanced real-time screen translator for games, hardcoded subtitles in videos, static text and etc. 项目地址: https://gitcode.com/gh_mirrors/tr/Translumo 还在为外语…

李华

终极JavaScript图像查看器Viewer.js完整指南：快速集成与高效使用

终极JavaScript图像查看器Viewer.js完整指南：快速集成与高效使用【免费下载链接】viewerjs JavaScript image viewer. 项目地址: https://gitcode.com/gh_mirrors/vi/viewerjs Viewer.js是一款功能强大的JavaScript图像查看器库，专为现代Web应用…

李华

NLP模型性能衰减检测与自动预警实践

1. 项目背景与核心挑战NLP模型部署后的性能衰减问题一直是工业界面临的痛点。去年我们上线了一个客服意图分类模型，上线初期准确率达到92%，但三个月后骤降至78%——这种"模型衰老"现象比我们预想的来得更快更猛。传统解决方案需要持续标注新数…