news 2026/2/16 12:12:37

gops 工具在 Cilium 中的应用指南

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
gops 工具在 Cilium 中的应用指南

目录

  • gops 工具在 Cilium 中的应用指南
    • 什么是 gops?
    • Cilium 环境中的 gops 实战演示
      • 场景 1: 列出所有 Go 进程
      • 场景 2: 获取进程统计信息
      • 场景 3: 查看内存统计
      • 场景 4: 检查 Goroutine 泄漏
    • Cilium 诊断实战
      • 当前节点 (qfusion2 / .148) 状态
      • 节点对比分析
    • 使用 Prometheus 替代 gops
    • 问题诊断流程
    • 结论
    • 参考链接

gops 工具在 Cilium 中的应用指南

什么是 gops?

gops=Go pprof,Go 语言官方的诊断工具,用于分析运行中的 Go 程序。

安装: go install github.com/google/gops@latest

Cilium 环境中的 gops 实战演示

场景 1: 列出所有 Go 进程

# 使用 gops$ gops983go-test-ci* go1.13.4 /usr/local/bin/go-test-ci52153gops go1.12 /Users/user/go/bin/gops# 在 Linux 上模拟 gops$psaux|grep-E"cilium|etcd|kube-apiserver"|grep-vgreproot1293553.50.5cilium-agent --config-dir=/tmp/cilium/config-map root282783312.20.7etcd --advertise-client-urls=https://... root282837031.25.2kube-apiserver --advertise-address=...

场景 2: 获取进程统计信息

# 使用 gops$ gops stats129355goroutines:32OS threads:32GOMAXPROCS:16# 模拟 gops stats$cat/proc/129355/status|grepThreads Threads:32$ps-p129355-o pid,comm,pcpu,pmem,etime PID COMMAND %CPU %MEM ELAPSED129355cilium-agent3.50.523:47:25

场景 3: 查看内存统计

# 使用 gops$ gops memstats129355alloc:1234567bytes total-alloc:987654321bytes sys:12345678bytes lookups:1234mallocs:56789frees:44444heap-live:1234567bytes# 模拟 gops memstats$cat/proc/129355/status|grep-E"Vm(RSS|Size|Data)"VmSize:934700kB VmRSS:162020kB VmData:211628kB

场景 4: 检查 Goroutine 泄漏

# 正常状态Threads:32✅ 正常(<50)# 警告状态Threads:150⚠️ 轻度增高(50-200)# 异常状态Threads:500❌ Goroutine 泄漏(>200)

Cilium 诊断实战

当前节点 (qfusion2 / .148) 状态

=== Cilium Agent 状态 === PID: 129355 运行时间: 23:47:25 CPU: 3.5% 内存: 162 MB (RSS) Threads: 32 文件描述符: 148 Hubble: 4095/4095 (100%) ⚠️ Flows/s: 186.74

节点对比分析

节点PodsThreads内存Hubble状态
qfusion153--4095/4095 (100%)队列满
qfusion2932162MB4095/4095 (100%)队列满
qfusion352--4095/4095 (100%)队列满

使用 Prometheus 替代 gops

由于 Cilium 默认不暴露 gops 端点,使用 Prometheus metrics:

# 获取运行指标$curlhttp://127.0.0.1:9962/metrics|grep-E"goroutine|gc_duration|memory"# 诊断命令$ kubectlexec-n kube-system cilium-xxx -- cilium status verbose $ kubectl logs -n kube-system cilium-xxx --tail=100

问题诊断流程

1. 发现问题: CPU 高 ↓ 2. 使用 gops/gops.sh 定位进程 ↓ 3. 检查 Threads/Goroutines 数量 ↓ 4. 检查内存使用情况 ↓ 5. 检查文件描述符 ↓ 6. 检查 Hubble 队列状态 ↓ 7. 使用 Prometheus metrics 确认 ↓ 8. 定位根本原因并解决

结论

  1. gops 是强大的 Go 诊断工具,但需要程序支持
  2. Cilium 使用 Prometheus metrics作为主要监控方式
  3. 可以模拟 gops 功能使用 /proc 和 ps 命令
  4. Hubble 队列溢出是导致 CPU 高的主要原因
  5. 解决方法: 增加hubble-event-queue-size参数

参考链接

  • gops GitHub: https://github.com/google/gops
  • Cilium Monitoring: https://docs.cilium.io/en/stable/observability/metrics/
版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/2/16 2:06:16

一篇文章讲清楚:中转API如何用Python调用ChatGPT

你是否遇到过这样的场景&#xff1f; 想把 ChatGPT 接入自己的应用&#xff0c;却被模型限制、价格波动、接口差异搞得一头雾水&#xff1b; 刚写好的代码&#xff0c;换一个模型就要重构一遍&#xff1b; 好不容易跑通了&#xff0c;又发现前端、后端、流式输出全都要重新适配…

作者头像 李华
网站建设 2026/2/13 9:12:41

深度测评9个论文写作工具,自考学生一键生成论文工具推荐!

深度测评9个论文写作工具&#xff0c;自考学生一键生成论文工具推荐&#xff01; 自考论文写作的革新之路 随着人工智能技术的飞速发展&#xff0c;越来越多的学生开始借助AI工具来提升论文写作效率。尤其是在自考群体中&#xff0c;面对繁重的学习任务和严格的论文要求&#x…

作者头像 李华
网站建设 2026/2/4 4:55:01

Product Hunt 每日热榜 | 2026-01-25

1. Humans in the Loop 标语&#xff1a;一个免费的社区&#xff0c;专门讨论与代理编程与人工智能相关的所有事。 介绍&#xff1a;“有人的参与”是一个为热爱利用人工智能加速工作的伙伴们打造的地方。这里是一个免费的社区&#xff0c;大家可以在这里分享关于Claude Code…

作者头像 李华
网站建设 2026/2/5 6:50:55

MATLAB实现基于二阶锥松弛技术的主动配电网故障重构模型与可视化展示

MATLAB代码&#xff1a;基于二阶锥松弛的主动配电网故障重构及可视化 关键词&#xff1a;配电网 故障重构 二阶锥松弛 可视化 参考文档&#xff1a;《基于禁忌克隆遗传算法的配电网故障恢复重构_张利民》参考故障重构部分模型&#xff1b;《二阶锥松弛在配电网最优潮流计算中的…

作者头像 李华
网站建设 2026/2/13 11:12:07

基于单片机的汽车倒车雷达超声波测距系统设计

目录系统概述硬件设计软件设计工作流程优化方向源码文档获取/同行可拿货,招校园代理 &#xff1a;文章底部获取博主联系方式&#xff01;系统概述 基于单片机的汽车倒车雷达超声波测距系统通过超声波传感器发射和接收信号&#xff0c;结合单片机处理数据并计算距离&#xff0c…

作者头像 李华