news 2026/7/2 8:35:08

gpustat——显存GPU利用率查看小工具

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
gpustat——显存GPU利用率查看小工具
  1. nvidia-smi(命令行,最基础)
nvidia-smi
  • 显示 GPU 利用率(Volatile GPU-Util)、显存占用、温度、功率等。
  • 实时刷新watch -n 1 nvidia-smi(Linux)或nvidia-smi -l 1(每秒刷新)。
  • 缺点:利用率有时不准确(在显存拷贝和 kernel 执行之间可能显示偏低)。

  1. gpustat(更美观,类似 nvidia-smi 的彩色版)
pipinstallgpustat gpustat-i1# 每秒刷新
  • 显示每个进程的 GPU 利用率、显存、用户、命令。

安装gpustat后,使用方法非常简单:

基本用法

直接在终端运行:

gpustat

这会显示当前 GPU 的状态(利用率、显存、温度、进程等),只刷新一次

常用选项(实时监控)

gpustat-i1# 每秒刷新一次,持续监控(按 Ctrl+C 退出)gpustat--color# 强制彩色输出(默认自动)gpustat-p# 显示进程的 PID 和命令名gpustat-c# 显示 GPU 利用率的历史图表(需要 `--watch` 或 `-i`)gpustat-u# 显示每个进程的 GPU 利用率(需要 root 或 sudo)

实用示例

场景命令
一次查看当前状态gpustat
每秒刷新,持续观察训练时的 GPU 波动gpustat -i 1
显示更详细的进程信息(PID、用户名)gpustat -p
每 0.5 秒刷新,带彩色和进程详情gpustat -i 0.5 -p

结合你之前的训练问题

当你运行训练脚本时,在另一个终端窗口执行:

gpustat-i0.5-p

观察:

  • 纯 Teacher Forcing 阶段GPU-Util应稳定在 90%+,每个 batch 处理时间较短。
  • 引入 Free Running 后GPU-Util可能仍很高,但你会看到进程的显存占用稳定,而刷新频率显示 GPU 在短时间内频繁启动/结束小 kernel,说明串行循环在消耗资源。

如果发现利用率低于 80% 且训练很慢,说明数据加载或串行循环导致 GPU 空闲等待;如果利用率 99% 但每个 batch 耗时很长,说明计算量本身大,需优化算法(并行计划采样)。


提示:如果gpustat命令找不到,可能是 Python 脚本目录未加入 PATH,可以尝试python -m gpustat或找到安装位置(通常在~/.local/bin/C:\Users\用户名\AppData\Roaming\Python\Scripts\)。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/7/2 8:30:31

EastWave应用:光场与石墨烯和特异介质相互作用的研究

图 1-1 模型示意图本案例使用“自动计算透反率模式”研究石墨烯和特异介质的相互作用,分析透反率在有无石墨烯存在情况下的变化。光源处于近红外波段。模型为周期结构,图中只显示了该结构的一个单元,其中绿色介质为石墨烯(采用无色…

作者头像 李华
网站建设 2026/7/2 8:30:13

连续血糖监测研究必备:Awesome-CGM数据集完全指南

连续血糖监测研究必备:Awesome-CGM数据集完全指南 【免费下载链接】Awesome-CGM List of CGM datasets 项目地址: https://gitcode.com/gh_mirrors/aw/Awesome-CGM 连续血糖监测数据集是糖尿病研究和健康科技创新的重要基石。Awesome-CGM项目汇集了全球顶尖研…

作者头像 李华
网站建设 2026/7/2 8:29:35

Function Calling实战:让大模型学会调用外部工具

一、什么是 Function Calling? Function Calling(函数调用)是 OpenAI 在 2023 年推出的一项重要功能,它允许大语言模型在生成文本的过程中,主动调用外部函数或 API,从而实现与外部世界的交互。 简单来说&…

作者头像 李华
网站建设 2026/7/2 8:28:43

计算机毕业设计之基于机器学习的乳腺肿瘤辅助诊断系统的设计与实现

基于机器学习的乳腺肿瘤辅助诊断系统是一项创新的技术应用,旨在通过先进的算法和大数据分析提高乳腺肿瘤诊断的准确性和效率。该系统整合了医学影像数据、患者病史以及相关的生物标志物信息,利用机器学习模型进行综合分析,为医生提供辅助诊断…

作者头像 李华