news 2026/5/7 14:47:31

Linux/Unix系统下的基础文本处理命令

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
Linux/Unix系统下的基础文本处理命令

Linux/Unix系统的文本处理命令之所以强大,在于它们的组合性和效率。这些命令通常遵循"做一件事并做好"的Unix哲学,每个工具专注于特定功能,通过管道机制灵活组合。

核心查看命令

  • cat- 连接并显示文件全部内容,也可合并多个文件:cat file1 file2 > combined.txt
  • less/more- 分页查看大文件,less功能更强(支持向前翻页、搜索):less huge_log.log
  • head- 查看文件开头,可指定行数:head -n 20 data.csv(看前20行)
  • tail- 查看文件末尾,实时监控:tail -f access.log(持续追踪日志变化)

搜索与过滤

  • grep- 模式匹配搜索,正则表达式支持:grep -r "error" ./logs/(递归搜索含"error"的行)
  • cut- 按字段或字符切割:cut -d',' -f1,3 data.csv(以逗号分隔,取第1、3列)
  • awk- 文本处理语言,支持复杂逻辑:awk '{print $1,$3}' file.txt(打印第1、3列)
  • sed- 流编辑器,批量替换/删除:sed 's/old/new/g' file.txt(全局替换)

统计与排序

  • wc- 统计信息:wc -l file.txt(只统计行数)
  • sort- 文本排序:sort -n -k2 data.txt(按第2列数值排序)
  • uniq- 去重统计:sort file.txt | uniq -c(先排序再统计重复次数)

实战组合示例

数据清洗管道cat data.csv | grep -v "^#" | cut -d',' -f1-3 | sort | uniq > cleaned.txt

  • 过滤注释行 → 提取前3列 → 排序 → 去重 → 保存

日志分析grep "ERROR" app.log | awk '{print $4}' | sort | uniq -c | sort -rn

  • 找错误行 → 提取第4列(如时间) → 统计重复 → 按频率降序

这些命令的学习曲线虽然初期有些陡峭,但一旦掌握,处理文本数据的效率会大幅提升,特别是处理GB级文件时,比GUI工具快几个数量级。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/3 6:33:35

IQuest-Coder-V1镜像使用指南:开箱即用部署推荐

IQuest-Coder-V1镜像使用指南:开箱即用部署推荐 1. 为什么你需要这个镜像——不是又一个代码模型 你可能已经试过不少代码大模型:有的生成函数能跑通但逻辑混乱,有的写算法题勉强及格却搞不定真实项目里的依赖管理,还有的在长上…

作者头像 李华
网站建设 2026/5/3 5:22:11

YOLOv10官方镜像+Docker,多平台部署毫无压力

YOLOv10官方镜像Docker,多平台部署毫无压力 在工厂质检线上,工业相机每秒抓拍数十帧PCB图像,系统必须在40毫秒内完成缺陷识别并触发剔除;在城市交通指挥中心,数百路高清视频流持续涌入,要求对车辆、行人、…

作者头像 李华
网站建设 2026/4/30 23:11:48

用测试开机脚本做了个自动任务,全过程分享给你

用测试开机脚本做了个自动任务,全过程分享给你 你有没有遇到过这样的场景:设备每次重启后,总得手动执行一串命令——比如拉起某个服务、检查网络状态、备份日志、或者定时同步配置?重复操作不仅费时,还容易遗漏。其实…

作者头像 李华
网站建设 2026/5/3 6:33:32

8、吃透Go语言container包:链表(List)与环(Ring)的核心原理+避坑指南

点击投票为我的2025博客之星评选助力! 吃透Go语言container包:链表(List)与环(Ring)的核心原理避坑指南 在Go语言开发中,我们最常使用的是数组、切片这类原生数据结构,但它们并非“银弹”——切片删除元素会引发大量复制&#xf…

作者头像 李华
网站建设 2026/5/4 18:19:09

Glyph学术数据库:论文长摘要处理部署案例

Glyph学术数据库:论文长摘要处理部署案例 1. 为什么需要处理长论文摘要? 你有没有遇到过这样的情况:下载了一篇顶会论文,PDF打开后发现摘要写了整整两页?不是写得啰嗦,而是这篇研究确实信息量巨大——方法…

作者头像 李华
网站建设 2026/5/3 14:52:59

Qwen2.5-0.5B部署避坑指南:常见错误与解决方案汇总

Qwen2.5-0.5B部署避坑指南:常见错误与解决方案汇总 1. 部署前必知:为什么选择Qwen2.5-0.5B? 在边缘设备或低配服务器上运行大模型,听起来像是天方夜谭。但 Qwen/Qwen2.5-0.5B-Instruct 的出现打破了这一认知。作为通义千问Qwen2…

作者头像 李华