news 2026/3/27 12:26:39

Python---实战拒绝加班!3行代码实现Word批量转PDF

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
Python---实战拒绝加班!3行代码实现Word批量转PDF

摘要:还在一个个打开Word点击“另存为PDF”?本文教你使用Python的docx2pdf库,仅需3行代码,即可瞬间完成成百上千个文档的格式转换。无废话,直接上实战。


0. 为什么写这篇文章?

昨天快下班时,同事发来一个文件夹,里面有50份合同(.docx),需要全部转成PDF发给客户。如果手动打开->另存为->关闭,至少需要半小时,还容易手抖点错。

使用Python,这只是30秒的事情。

1. 环境准备

我们需要用到一个神器库:docx2pdf

前置条件:

  1. 电脑上安装了 Python 3.x。

  2. 电脑上安装了 Microsoft Word(因为该库在Windows下调用Word的COM接口,在Mac下调用JXA)。

安装命令:

打开终端(CMD/PowerShell/Terminal),输入:

Bash

pip install docx2pdf

2. 实战演练

场景一:转换单个文件

如果你只想转换一个特定的文件,代码非常简单。

新建文件one_file.py

Python

from docx2pdf import convert # 语法:convert("原文件路径", "目标文件路径") convert("offer_letter.docx", "offer_letter.pdf") print("转换完成!")

场景二:批量转换整个文件夹(核心实战)

这是最常用的场景。你只需要指定文件夹路径,脚本会自动识别里面所有的.docx文件并将其转换为PDF,保存在同一目录下。

新建文件batch_convert.py

Python

from docx2pdf import convert import os # 定义你的文件夹路径 (Windows下注意路径中的斜杠) folder_path = r"C:\Users\Admin\Desktop\Contracts" print(f"开始转换文件夹: {folder_path} ...") # 一行代码搞定整个文件夹的转换 convert(folder_path) print("所有文件转换完毕!")

注意:Windows用户建议在路径字符串前加r,防止转义字符报错。


3. 进阶:带进度条的转换(看起来更专业)

虽然上面的代码能用,但如果文件很多,我们想知道进度怎么办?docx2pdf自带进度条显示,但如果我们想结合tqdm(Python最美进度条库) 自己写逻辑,可以这样控制:

安装 tqdm:

Bash

pip install tqdm

完整代码:

Python

import os from docx2pdf import convert from tqdm import tqdm def batch_convert_with_progress(target_folder): # 获取文件夹内所有docx文件 files = [f for f in os.listdir(target_folder) if f.endswith('.docx')] if not files: print("该目录下没有Word文档。") return print(f"共发现 {len(files)} 个文件,准备开始转换...") # 使用进度条循环 for filename in tqdm(files, desc="转换进度"): docx_path = os.path.join(target_folder, filename) pdf_path = os.path.join(target_folder, filename.replace(".docx", ".pdf")) # 转换单个文件 try: convert(docx_path, pdf_path) except Exception as e: print(f"文件 {filename} 转换失败: {e}") if __name__ == "__main__": # 替换为你自己的文件夹路径 my_folder = r"C:\Users\Admin\Desktop\TestFiles" batch_convert_with_progress(my_folder)

运行效果:

你会在控制台看到一个动态的进度条,实时显示处理了多少个文件。


4. 避坑指南

在实战中,可能会遇到以下两个常见问题:

  1. 报错CoInitialize has not been called

    • 原因:通常发生在多线程操作中。

    • 解决:本文的单线程脚本一般不会出现。如果出现,只需使用pythoncom.CoInitialize()初始化即可。

  2. Word卡死或报错

    • 原因:转换过程中请不要手动打开Word文档,否则会冲突。

    • 建议:运行脚本前,关闭所有Word窗口。


5. 总结

别再做“文档搬运工”了。通过docx2pdf库:

  • 1行代码convert("文件夹路径")即可实现批量转换。

  • 0 理论:不需要了解底层的PDF编码原理。

  • 100% 效率:留出更多时间去学习新技术(或者摸鱼)。

赶紧把这个脚本保存起来,下次遇到批量任务时直接运行!


下一步建议

您希望我为您提供关于“如何使用 Python 自动发送带附件的邮件”的教程吗?这样就可以实现“自动转换 -> 自动发送”的全自动化流程了。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/3/27 5:46:04

如何提升零样本克隆的音质还原度?技巧分享

如何提升零样本克隆的音质还原度?技巧分享 在数字人、虚拟主播和个性化语音助手日益普及的今天,用户早已不再满足于“能说话”的机器语音。他们期待的是有温度、有辨识度、像真人一样的声音——哪怕只听过几秒钟原声,也能精准复刻出那个熟悉的…

作者头像 李华
网站建设 2026/3/26 16:54:36

又一院士名单,公布

点击下方卡片,关注“CVer”公众号 AI/CV重磅干货,第一时间送达 点击进入—>【顶会/顶刊】投稿交流群 添加微信号:CVer2233,小助手拉你进群! 扫描下方二维码,加入CVer学术星球!可以获得最新顶…

作者头像 李华
网站建设 2026/3/27 9:03:46

ICML 2026 投稿群来了!还有IJCAI、ICLR 2026 投稿交流群!

点击下方卡片,关注“CVer”公众号AI/CV重磅干货,第一时间送达点击进入—>【顶会/顶刊】投稿交流群添加微信:CVer2233,助手会拉你进群!扫描下方二维码,加入CVer学术星球!可获得最新顶会/顶刊上…

作者头像 李华
网站建设 2026/3/25 9:01:27

超越兼容:金仓数据库如何以三重革新,破解企业核心业务运维难题

兼容是对企业历史投资的尊重是确保业务平稳过渡的基石然而这仅仅是故事的起点在数字化转型的深水区,企业对数据库的需求早已超越“语法兼容”的基础诉求。无论是核心业务系统的稳定运行,还是敏感数据的安全防护,亦或是复杂场景下的性能优化&a…

作者头像 李华
网站建设 2026/3/24 19:51:17

Win11 查找并开启 IE 浏览器教程

Win11 正式发布后,不少用户第一时间升级了新系统,却发现找不到熟悉的IE浏览器。其实这是因为微软已在 Win11 中正式移除了的独立前端程序,但它的核心内核仍被系统保留。下面就为大家分享 Win11 开启 IE 浏览器的具体操作步骤: 右…

作者头像 李华