news 2026/5/15 13:03:52

Pyroscope Java 接入最佳实践

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
Pyroscope Java 接入最佳实践

Pyroscope

Pyroscope 是 Grafana 开源的持续性能分析平台,旨在帮助用户从应用程序中获取性能洞察,以优化资源使用,如 CPU、内存和 I/O 操作。将 Pyroscope 数据上报到观测云,使用户能够全面了解应用程序的行为,并能够深入到特定服务中进行更精确的根源分析。Pyroscope 为 OpenTelemetry 补全了 Profiling 能力,同时,可以实现 Profiling 与 Tracing 的关联。

核心功能

  • 持续性能分析:通过持续分析应用程序的性能,帮助团队快速识别性能瓶颈并优化应用程序。
  • 低开销和高效压缩:确保在生产环境中进行性能分析时对应用程序的性能影响最小。
  • 多语言支持:客户端 SDK 支持多种编程语言,包括 Go、Java、Python、Ruby、PHP 和 .NET。
  • 灵活的部署方式:支持在多种环境中部署,包括 Kubernetes 等。

使用场景

  • 主动优化:通过持续监控减少资源消耗,提高应用程序性能,预防延迟问题。
  • 快速响应:在发生性能问题时,能够快速定位并解决,例如调试 CPU、内存或 I/O 瓶颈。

支持类型

Pyroscope 支持采集以下数据类型:

  • CPU 使用情况
  • 内存使用情况
  • I/O 操作
  • 调用栈(Call Stacks)
  • 分配的内存(Heap & Allocation)
  • 协程或线程的使用情况
  • 函数级性能数据

接入观测云

实现说明

OpenTelemtry 链路与 pyroscope profiling 数据关联实现原理,主要是通过给 profiling 和 tracing 注入 runtime_id 标签。

主机部署

  • 开启 opentelemetry 及 pyroscope 采集器

进入 DataKit 安装目录下,执行以下命令:

# 开启opentelemetry cd /usr/local/datakit/conf.d/ cp samples/opentelemetry.conf.sample opentelemetry.conf # 开启pyroscope cd /usr/local/datakit/conf.d/ cp samples/pyroscope.conf.sample pyroscope.conf
  • 重启 DataKit
datakit service -R

接入 JAVA 应用

  • pyroscope-java 是基于 async-profiler 的增强版本。
  • pyroscope-otel 是基于 pyroscope-java 封装的 OpenTelemetry 版本,意在与 OpenTelemetry APM 进行融合。
下载依赖
  • pyroscope-otel 下载地址: https://repo1.maven.org/maven2/io/pyroscope/otel/0.11.0/otel-0.11.0.jar,重命名为 pyroscope-otel.jar
  • opentelemetry-java 下载地址: https://github.com/open-telemetry/opentelemetry-java-instrumentation/releases
  • Agent 代码仓库:https://github.com/grafana/otel-profiling-java/releases
启动参数

java 应用启动命令如下,供参考。

注意: UUID 为注入的随机id ,用于关联trace 与 profile 的关联id 赋值,需要确保UUID 能正常被应用。

Shell UUID=$(uuidgen) \ # 实例维度的uuid,保证实例的唯一性 OTEL_SERVICE_NAME="springboot-server" \ OTEL_RESOURCE_ATTRIBUTES="runtime_id=$UUID,service.name=springboot-server,service.version=1.3.55,service.env=dev" \ OTEL_JAVAAGENT_EXTENSIONS=./pyroscope-otel.jar \ OTEL_TRACES_EXPORTER=otlp \ OTEL_EXPORTER_OTLP_PROTOCOL="grpc" \ OTEL_EXPORTER_OTLP_ENDPOINT="http://datakit-service.datakit:4317" \ # PYROSCOPE 配置 PYROSCOPE_APPLICATION_NAME="springboot-server" \ OTEL_PYROSCOPE_START_PROFILING=true \ PYROSCOPE_FORMAT="jfr" \ PYROSCOPE_PROFILER_EVENT="cpu" \ PYROSCOPE_LABELS="runtime_id=$UUID,service=springboot-server,version=1.3.55,env=dev" \ PYROSCOPE_UPLOAD_INTERVAL="10s" \ PYROSCOPE_JAVA_STACK_DEPTH_MAX=512 \ PYROSCOPE_PROFILING_INTERVAL="10ms" \ PYROSCOPE_PROFILER_ALLOC=512k \ PYROSCOPE_ALLOC_LIVE=true \ PYROSCOPE_SERVER_ADDRESS="http://datakit-service.datakit:9529" \ java -javaagent:opentelemetry-javaagent.jar -jar springboot-server.jar

按照实际业务需求选择合适的参数:

  • opentelemetry-java 相关参数参考 OpenTelemetry 官方文档。
  • pyroscope 相关参数参考 Pyroscope 官方文档,部分参数说明如下:

配置说明

FlagDescription
PYROSCOPE_AGENT_ENABLED启用代理。默认值为true。
PYROSCOPE_SERVER_ADDRESS上报地址
PYROSCOPE_FORMAT设置分析器输出格式。默认值为collapsed,但为了支持多种格式,必须将其设置为jfr。
PYROSCOPE_PROFILER_EVENT设置分析器事件。在启用JFR格式时,此事件指可能的CPU分析事件之一:itimer、cpu、wall。默认值为itimer。
PYROSCOPE_PROFILER_ALLOC设置注册事件的分配阈值(以字节为单位,相当于async-profiler中的--alloc=)。默认值为空字符串(""),表示禁用分配分析。将其设置为0将注册每个事件,导致显著的CPU和网络开销,不适合生产环境。建议的起始值为512k,并根据需要进行调整。
PYROSCOPE_PROFILER_LOCK设置注册事件的锁阈值(以纳秒为单位,相当于async-profiler中的--lock=)。默认值为空字符串(""),表示禁用锁分析。将其设置为0将注册每个事件,导致显著的CPU和网络开销,不适合生产环境。建议的起始值为10ms,并根据需要进行调整。
PYROSCOPE_CONFIGURATION_FILE设置额外的属性配置文件。默认值为pyroscope.properties。
PYROSCOPE_BASIC_AUTH_USERHTTP Basic身份验证用户名。默认值为空字符串(""),表示无身份验证。
PYROSCOPE_BASIC_AUTH_PASSWORDHTTP Basic身份验证密码。默认值为空字符串(""),表示无身份验证。
PYROSCOPE_TENANT_IDpyroscope租户ID,作为X-Scope-OrgID HTTP头传递。默认值为空字符串(""),表示无租户ID。
PYROSCOPE_HTTP_HEADERS额外的HTTP头(以JSON格式),例如:{"X-Header": "Value"}。默认值为{},表示无额外头。
PYROSCOPE_LABELS设置以逗号分隔的key=value对形式的静态标签。默认值为空字符串(""),表示无标签。
PYROSCOPE_LOG_LEVEL确定Pyroscope日志记录器的详细程度。可用选项包括debug、info、warn和error。默认值为info。
PYROSCOPE_PUSH_QUEUE_CAPACITY指定在网络中断期间临时在内存中存储分析数据的摄取队列的大小。默认值为8。
PYROSCOPE_INGEST_MAX_TRIES设置在失败时重试摄取API调用的最大次数。值为-1表示重试将继续进行,直到成功。默认值为8。
PYROSCOPE_EXPORT_COMPRESSION_LEVEL_JFR设置上传到JFR文件的GZIP压缩级别。此选项接受的值包括NO_COMPRESSION、BEST_SPEED、BEST_COMPRESSION和DEFAULT_COMPRESSION。
PYROSCOPE_EXPORT_COMPRESSION_LEVEL_LABELS与PYROSCOPE_EXPORT_COMPRESSION_LEVEL_JFR类似,但适用于动态标签部分。默认值为BEST_SPEED。
PYROSCOPE_GC_BEFORE_DUMP布尔值,当设置为true时,在转储分析文件之前执行System.gc()命令。此选项可能对实时分析有用,但默认情况下是禁用的。

效果演示

观测云在采集 profiling 数据时可以通过一些配置实现 profiling 与 tracing 数据的关联,其原理主要是通过给 profiling 和 tracing 注入 runtime_id 标签实现关联,在链路中可以点击代码热点,可以看到关联的 profiling 信息。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/10 17:26:42

【渲染的抗锯齿终极指南】:揭秘图像锯齿根源与5种高效解决方案

第一章:渲染的抗锯齿在计算机图形学中,抗锯齿(Anti-Aliasing)是提升图像视觉质量的关键技术之一。由于数字图像由离散像素构成,在渲染斜线或曲线边缘时容易出现阶梯状的“锯齿”现象。抗锯齿通过平滑这些边缘&#xff…

作者头像 李华
网站建设 2026/5/10 15:56:26

【医疗行业数据防护】:满足HIPAA合规要求的5大技术控制措施

第一章:医疗数据的 HIPAA 合规概述在医疗信息化快速发展的背景下,保护患者隐私和确保数据安全成为核心议题。HIPAA(Health Insurance Portability and Accountability Act)作为美国医疗数据保护的基石性法规,为个人健康…

作者头像 李华
网站建设 2026/5/6 6:07:22

为什么你的低代码PHP系统总被越权?5大核心校验机制必须掌握

第一章:为什么你的低代码PHP系统总被越权?在低代码开发盛行的今天,许多PHP系统通过可视化拖拽快速构建业务模块,但随之而来的安全问题日益突出,尤其是越权访问。开发者往往误以为“功能上线即安全”,却忽略…

作者头像 李华
网站建设 2026/5/10 16:44:46

【独家披露】PHP 8.6性能监控面板设计原理与最佳实践

第一章:PHP 8.6性能监控面板概述PHP 8.6 引入了全新的内置性能监控面板,旨在为开发者提供实时、细粒度的运行时洞察。该面板集成于 Zend 引擎核心,无需额外安装扩展即可启用,适用于开发与生产环境的性能调优。核心功能 实时展示请…

作者头像 李华
网站建设 2026/5/11 10:08:46

推荐一些机器视觉检测光源的优秀品牌

思奥特智能-专业机器视觉光源领导品牌 产品优势与技术特色 1. 完整的产品矩阵 思奥特智能提供50多款机器视觉光源产品,包括: 点光源、同轴光源系列 侧发光开孔面光源、平行3面光源 四面可调光源、高亮条形光源 转角同轴光源、投射补光灯 平面同轴光源、圆…

作者头像 李华
网站建设 2026/4/30 5:50:47

Top 8内存监控工具对比:只有1%工程师知道的最佳实践

第一章:内存监控的核心价值与行业现状内存监控作为系统性能管理的关键环节,直接影响应用程序的稳定性与响应效率。在高并发、大数据处理场景日益普及的今天,内存资源的合理分配与实时追踪已成为保障服务可用性的核心手段。内存问题带来的典型…

作者头像 李华