news 2026/5/5 23:26:27

YOLO训练入门(下)学习笔记(第四集)

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
YOLO训练入门(下)学习笔记(第四集)

⏱ 00:02 - 00:30|核心类比:训练 = 管员工

  • 电脑硬件(CPU / GPU / 内存)= 员工
  • 模型训练 = 让员工干活

👉 核心思想:

不要让硬件偷懒,也不要让它过劳崩溃


⏱ 00:30 - 01:36|如何判断训练速度?

❗关键点

  • 不看 epoch(轮数)
  • 看每一轮耗时(重点是第一个进度条)

📊 进度条时间含义

  • 左边:已用时间
  • 右边:预计剩余时间

👉 示例:

  • 已用 17 秒 + 剩余 20 秒 ≈ 总 37 秒

👉 结论:

第一个进度条时间 ≈ 单轮训练耗时


⏱ 01:39 - 04:11|训练效率的本质(非常重要⭐)

训练速度 ≠ 一个数字
👉 本质是4种硬件利用率

🧩 四大核心资源

  • CPU
  • 内存(RAM)
  • GPU(CUDA利用率)
  • 显存(GPU Memory)

🔧 如何查看 CUDA?

如果任务管理器看不到:

  1. 关闭“硬件加速 GPU 计划”
  2. 重启电脑
  3. 在GPU面板选择 CUDA

✅ 高效训练的两个特征

1️⃣CUDA利用率:高且稳定
2️⃣所有资源:不达到100%


⚠️ 为什么不能100%?

  • 会报错(OOM等)
  • 系统降速保护
  • 训练反而变慢

👉 人话:

榨干=崩溃,留点余量=更稳更快


⏱ 04:23 - 05:06|CPU vs GPU训练对比

实验:

device = "cpu"

结果:

  • GPU不用了(CUDA=0)
  • CPU负载上升
  • 训练时间暴涨(37秒 → 接近5分钟)

👉 结论:

GPU训练 ≫ CPU训练(数量级差距)


⏱ 05:26 - 11:12|参数一:image size(图像尺寸)


📦 训练流程(重要理解)

  1. 图片缩放到统一尺寸(如640×640)
  2. 打包成数据块
  3. 输入模型训练

👉 核心原因:

统一尺寸 = 提高计算效率


⚡ 速度影响

image size计算量速度

👉 实测:

  • 640 → 37秒
  • 320 → 29秒
  • 更小 → 提升有限(有上限)

⚠️ 限制

  • 必须是32的倍数
  • 最小:32

🎯 对效果的影响(重点!)

❌ 太小:
  • 图片变马赛克
  • 模型学不到特征
❌ 太大:
  • 图片变模糊(放大)
  • 训练慢 + 效果不一定好

✅ 推荐策略

默认:

imgsz = 640

🔍 什么时候调整?

✔ 调大(如1280)
  • 图片大 + 目标小
✔ 调小(如512)
  • 图片本身小
  • 放大会模糊
❌ 极端情况
  • 图片小 + 目标小
    👉直接换数据集

⏱ 11:15 - 16:25|参数二:Batch(批量大小)


📦 什么是 Batch?

  • 一次喂给模型的图片数量
  • 👉 一轮训练 = 多个 batch

📊 示例

  • 1052 张图片
  • Batch=2 → 526批
  • Batch=8 → 132批

⚡ 影响规律

Batch显存占用速度
太大爆显存报错

❗关键结论

Batch越大越快(但有上限)


💥 错误示例

batch = 999

👉 直接 OOM(显存炸)


🧠 最优策略

batch = -1

👉 YOLO自动帮你找最优(AutoBatch)

⏱ 16:57 - 20:33|参数三:Cache(缓存)


🧠 问题本质

默认流程:

每个batch都要从硬盘读图片 → 很慢


🚀 cache="ram" 做了什么?

训练前:

  1. 所有图片加载进内存
  2. 提前缩放

训练时:

  • 直接用 → 跳过读取 + 预处理

⚡ 效果

  • 21秒 → 18秒(略提升)

💾 代价

  • 占用内存(例:+1GB)

🎯 适用场景(重点)

✔ 图片很大(几千像素)
✔ 训练很慢 + CUDA利用率低


🧠 核心思想

常用数据 → 放近一点(内存)


⏱ 21:01 - 25:24|参数四:Workers(多进程)


🧠 问题本质

  • batch打包 + 数据增强是耗时的
  • 如果跟不上GPU → GPU会“干等”

🚀 解决方案

👉 多进程打包(Workers)


⚡ 效果

  • 18秒 → 11秒(巨大提升)

💾 代价

  • 每+1 worker → 内存翻倍消耗

📊 规律

Workers内存速度
太高爆内存慢/报错

人多不一定快,合适最重要


⏱ 27:14 - 结尾|实战建议

✅ 推荐训练状态

  • 负载:70% ~ 80%
  • 不要满载
  • 训练时别干别的事

🧾 总结(重点复习版)

🎯 提升训练速度四大参数

参数作用核心策略
image size控制计算量默认640
batch控制并行量用-1自动
cache减少IO内存够就开
workers加速数据处理适量

🧠 最核心一句话

训练优化本质 = 让GPU一直高效干活,同时别让任何资源成为速度瓶颈

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/5 23:20:37

使用 Taotoken CLI 工具一键生成并写入多款开发工具的配置文件

使用 Taotoken CLI 工具一键生成并写入多款开发工具的配置文件 1. Taotoken CLI 工具概述 Taotoken CLI 工具(taotoken/taotoken)是为开发者提供的命令行工具,支持快速配置多种大模型开发工具的运行环境。通过交互式菜单或子命令&#xff0…

作者头像 李华
网站建设 2026/5/5 23:17:55

大语言模型逻辑验证框架:原理、实现与应用

1. 项目背景与核心价值大语言模型在文本生成、问答系统等任务中展现出惊人能力,但其逻辑推理的可靠性和一致性始终是业界痛点。我在实际项目中发现,当模型需要处理数学证明、法律条文解析或复杂决策场景时,经常出现前后矛盾、违反基本逻辑规则…

作者头像 李华
网站建设 2026/5/5 23:15:22

初创公司如何借助Taotoken快速低成本验证多个大模型效果

初创公司如何借助Taotoken快速低成本验证多个大模型效果 1. 初创团队的技术选型挑战 对于资源有限的初创团队而言,在技术选型阶段面临的核心矛盾是验证需求与成本约束。大模型能力验证通常需要同时测试多个主流模型在真实业务场景中的表现,但直接对接各…

作者头像 李华
网站建设 2026/5/5 23:15:20

量子退火在计算机视觉多旋转平均问题中的应用

1. 量子多旋转平均(MRA)问题概述在计算机视觉领域,多旋转平均(Multiple Rotation Averaging, MRA)是一个基础但极具挑战性的优化问题。简单来说,就是当我们有一堆相机拍摄的图片时,需要计算出每…

作者头像 李华
网站建设 2026/5/5 23:14:30

为AI智能体注入After Effects级动效:hyperframes-motion技能集成指南

1. 项目概述与核心价值 最近在折腾AI智能体(AI Agent)的开发,特别是想给它们加上点“视觉表现力”。我发现很多Agent的交互界面还是停留在纯文本或者简单的卡片式UI上,缺乏动态吸引力。这让我想起了以前做视频时常用的Adobe After…

作者头像 李华
网站建设 2026/5/5 23:10:32

UniApp微信小程序地图标绘:从点击到闭合,手把手教你实现房屋位置标注(附双击事件模拟方案)

UniApp微信小程序地图标绘实战:精准绘制与双击事件模拟全解析 在房产信息登记、区域范围标注等场景中,地图标绘功能的需求日益增长。想象一下这样的场景:用户需要在地图上精确勾勒出房屋轮廓或地块边界,而传统的单点标记已无法满足…

作者头像 李华