news 2026/3/5 11:32:21

打包与压缩:从 Linux 命令行到 Python 脚本

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
打包与压缩:从 Linux 命令行到 Python 脚本

在数据处理、系统运维和软件分发中,我们经常需要将多个文件或整个目录整理成一个整体,并尽可能减小其体积以便存储或传输。这一过程通常分为两个步骤:打包(归档)压缩。在 Linux 生态中,tar负责打包,gzip负责压缩;而在 Python 中,tarfilegzip模块则提供了等效的程序化接口。

本文将围绕“打包与压缩”这一核心主题,系统讲解如何在Linux 命令行Python 脚本中高效完成相关操作,涵盖单文件压缩、多文件归档、内容查看、完整性验证以及自动化处理等实用场景。

一、打包与压缩的基本概念

为什么需要先打包再压缩?

  • 压缩工具(如 gzip)只能处理单个文件。若直接对目录运行gzip,会报错。
  • 打包工具(如 tar)可将多个文件/目录合并为一个归档文件,但不减小体积。
  • 组合使用:先用tar打包,再用gzip压缩,既保留了文件结构,又实现了体积优化。

最终产物通常是.tar.gz(或.tgz)文件,这是 Linux 下最标准的归档压缩格式。

二、Linux 命令行中的打包与压缩

1. 使用 tar 打包(不压缩)

tar-cf archive.tar /path/to/dir
  • -c:创建新归档
  • -f:指定输出文件名
    生成的archive.tar是未压缩的打包文件,体积与原目录相近。

2. 打包并压缩为 .tar.gz

tar-czf backup.tar.gz /path/to/dir
  • -z:启用 gzip 压缩
    此命令一步完成打包与压缩,是日常最常用的操作。

3. 解压 .tar.gz 文件

tar-xzf backup.tar.gz
  • -x:解包
  • -z:自动识别 gzip 压缩
  • -f:指定文件

可添加-C /target/dir指定解压路径。

4. 查看归档内容(不解压)

列出文件列表:

tar-tzf backup.tar.gz

5. 单文件压缩(仅 gzip)

对于单个日志或文本文件,可直接使用 gzip:

gzipaccess.log# 生成 access.log.gzgunzip access.log.gz
版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/3/3 15:14:30

科普|宏智树AI开题报告神器:小白避坑指南,告别导师反复打回

作为深耕论文写作科普的博主,后台每天都能收到大量粉丝的开题求助:“开题报告改了4版,导师还是说逻辑乱”“选题要么太大要么太小,始终踩不到审核要点”“文献综述只会堆砌摘要,被批没有研究脉络”“技术路线画得乱七八…

作者头像 李华
网站建设 2026/3/4 0:26:06

从S锁/X锁到Next-Key Lock:MySQL锁机制硬核拆解

从 S 锁 / X 锁 到 Next-Key Lock:MySQL InnoDB 锁机制硬核拆解 MySQL 的 InnoDB 引擎锁机制是面试和生产中高频考点,尤其是幻读如何被解决、Next-Key Lock 到底锁了什么、加锁规则如何判断等。下面从基础到进阶,一层层拆解。 1. 锁的分类总…

作者头像 李华
网站建设 2026/3/4 4:19:06

PPML 估计 + 一般均衡求解?ge_gravity2 一套 Stata 命令全搞定

温馨提示:若页面不能正常显示数学公式和代码,请阅读原文获得更好的阅读体验。 丁闪闪 (lianxhcn163.com) 曾咏新 厦门大学 (zengyongxinhpe163.com) 提要:本文系统整理了金融大语言模型 (LLM) 研究的核心资源,包括 12 个主流金融数…

作者头像 李华
网站建设 2026/3/4 4:08:34

leetcode 930. Binary Subarrays With Sum 和相同的二元子数组

Problem: 930. Binary Subarrays With Sum 和相同的二元子数组 前缀和,哈希表记录每个和所在的索引i,对goal0分开讨论的,使用前缀和- goal,拿到s prefixSum[i1] - goal;,数可能的子数组个数,并累加 Code …

作者头像 李华
网站建设 2026/3/4 1:19:25

探秘AI教材写作!这些工具能让你的教材生成过程低查重率

在编写教材的过程中,总是能精准触及“慢节奏”带来的种种问题。尽管已经准备好了框架和资料,却总是在内容写作上卡住——一段话反复推敲半个小时,还是觉得表达不够准确;章节间的过渡连接,更是绞尽脑汁也想不出合适的词…

作者头像 李华
网站建设 2026/3/4 1:50:24

四光吊舱多光谱融合技术解析

四光吊舱的多光谱融合,核心在于将可见光、热成像等不同波段的传感器数据进行协同处理和智能分析。这不仅能让你“看见”,更能让你“看透”复杂场景。多光谱融合模块的技术要点这项技术主要围绕硬件集成、算法处理和环境适应三个层面展开,下表…

作者头像 李华