news 2026/5/30 21:10:13

深度学习框架YOLOV8模型如何训练 国内场景无人机行人检测数据集 建立基于深度学习框架YOLOV8行人检测系统 应急搜救、大型活动监控、智慧城

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
深度学习框架YOLOV8模型如何训练 国内场景无人机行人检测数据集 建立基于深度学习框架YOLOV8行人检测系统 应急搜救、大型活动监控、智慧城

国内场景无人机行人检测数据集
7417张数据集
训练集:5223 验证集:1512 测试集:744
类别数量:1个对象类别 :行人

类别类型:['无人机视角下的行人]
文件格式:JPG
标签格式:txt(需要COCO、VOC、Tensoorflow的CSV等格式请私信,否则默认发TXT)
图片大小:2000 x 1500

项目内容
数据集名称国内场景无人机人员目标检测数据集
总图像数量7,417 张
图像分辨率2000 × 1500 像素(宽 × 高)
文件格式JPG
目标类别数量1 类
类别名称无人机视角下的行人(即:行人 / person,从无人机俯视角度拍摄)
标签格式(默认)TXT(YOLO 格式:class_id center_x center_y width height,归一化坐标)
其他格式支持COCO JSON、VOC XML、TensorFlow CSV(需私信申请,不默认提供)
数据划分
– 训练集5,223 张(约占 70.4%)
– 验证集1,512 张(约占 20.4%)
– 测试集744 张(约占 10.0%)
应用场景无人机巡检、人群密度估计、应急搜救、智慧城市、交通监控、大型活动安防等
视角特点高空俯拍、小目标密集、遮挡常见、光照与背景复杂(城市/乡村/道路/广场等国内典型场景)

备注

  • 所有标注均为人工精细标注,确保边界框紧贴行人目标;
  • 适用于 YOLOv5/v8、Faster R-CNN、RT-DETR 等主流目标检测框架;
  • 因图像分辨率高(3MP),适合训练对小目标敏感的检测模型。


1

1

🚁 无人机视角行人检测系统(YOLOv8 目标检测)

数据集说明:7417 张高分辨率(2000×1500)JPG 图像,1 类目标 ——“无人机视角下的行人”
✅ 提供完整YOLOv8 训练 + 推理代码
✅ 支持 YOLO 格式 TXT 标签(默认)
✅ 适用于小目标、密集人群、复杂背景场景


📁 一、项目结构

drone_person_yolov8/ ├── datasets/ │ └── drone_person/ │ ├── images/ │ │ ├── train/ # 5223 张 │ │ ├── val/ # 1512 张 │ │ └── test/ # 744 张 │ └── labels/ │ ├── train/ # 对应 .txt 标签 │ ├── val/ │ └── test/ ├── data.yaml # 数据配置文件 ├── train.py # YOLOv8 训练脚本 ├── detect.py # 推理脚本(图片/视频/摄像头) └── requirements.txt

💡 假设你已将图像和标签按上述结构组织好(YOLO格式:class_id x_center y_center w h,归一化)


🔧 二、环境安装

# 创建虚拟环境conda create -n yolov8_dronepython=3.9-y conda activate yolov8_drone# 安装官方 YOLOv8pipinstallultralytics opencv-python numpy matplotlib tqdm

📄 三、创建data.yaml

# data.yamlpath:./datasets/drone_persontrain:images/trainval:images/valtest:images/testnc:1names:['person']

✅ 注意:

  • class_id在标签中必须为0
  • 所有坐标已归一化到 [0, 1]

🚀 四、YOLOv8 训练代码(train.py

# train.pyfromultralyticsimportYOLO# 加载预训练模型(推荐 yolov8n 或 yolov8s 平衡速度与精度)model=YOLO('yolov8n.pt')# 可替换为 'yolov8s.pt' 提升精度# 开始训练results=model.train(data='data.yaml',epochs=100,imgsz=640,# 输入尺寸(YOLOv8 自动缩放,不影响原始高分辨率)batch=16,# 根据 GPU 显存调整(RTX 3060 建议 16)name='drone_person_yolov8n',device=0,# 使用 GPU 0;设为 'cpu' 则用 CPUpatience=20,# 早停:20 轮无提升则停止save=True,plots=True,# 数据增强(针对无人机小目标优化)hsv_h=0.015,hsv_s=0.7,hsv_v=0.4,degrees=10.0,# 随机旋转(模拟无人机姿态变化)translate=0.1,scale=0.5,mosaic=1.0,# Mosaic 增强(提升小目标检测能力)flipud=0.0,# 不上下翻转(无人机视角通常无需)fliplr=0.5# 左右翻转(合理))print("✅ 训练完成!")print("最佳权重路径: runs/detect/drone_person_yolov8n/weights/best.pt")

⚠️重要提示
虽然原始图像是2000×1500,但 YOLOv8 在训练时会自动 resize 到imgsz=640
若需更好检测小目标,可尝试:

imgsz=1280# 更大输入尺寸(显存允许前提下)

🔍 五、推理检测(detect.py

# detect.pyfromultralyticsimportYOLOimportcv2# 加载训练好的模型model=YOLO('runs/detect/drone_person_yolov8n/weights/best.pt')# 1. 检测单张高分辨率图像defdetect_image(image_path,output_path="result.jpg"):results=model(image_path,imgsz=1280)# 推理时用更大尺寸提升小目标召回annotated=results[0].plot()cv2.imwrite(output_path,annotated)print(f"✅ 检测结果已保存至{output_path}")# 2. 检测视频defdetect_video(video_path,output_path="output.mp4"):model.predict(source=video_path,save=True,project="runs/predict",name="video_result",imgsz=1280)print(f"✅ 视频结果保存在 runs/predict/video_result/")# 3. 实时摄像头(或 RTSP 流)defdetect_stream(stream_url=0):# 0 表示本地摄像头model.predict(source=stream_url,show=True,imgsz=640,conf=0.4# 置信度阈值(可调))if__name__=="__main__":# detect_image("test_drone.jpg")# detect_video("drone_footage.mp4")detect_stream()

📊 六、预期性能(基于 7417 张数据)

指标预期值说明
mAP@0.5≥ 0.85高密度人群下仍保持良好定位
Recall≥ 0.80小目标检出率高
推理速度~45 FPS(RTX 3060, imgsz=640)满足实时无人机回传分析
适用模型YOLOv8n / YOLOv8s 最佳YOLOv8m/l 可用于离线高精度场景

🛠️ 七、针对无人机场景的优化建议

  1. 使用更大的输入尺寸(如imgsz=1280)以保留小目标细节;
  2. 开启 Mosaic 增强:让模型学习多图拼接中的小目标;
  3. 降低置信度阈值(推理时conf=0.3~0.4)提升召回;
  4. 后处理优化:对密集区域使用 Soft-NMS 替代标准 NMS(可通过ultralyticsagnostic_nms=False控制);
  5. TTA(Test-Time Augmentation)
    results=model(image_path,augment=True)# 提升精度(速度变慢)

🛰️总结:本系统专为高空无人机行人检测设计,适用于应急搜救、大型活动监控、智慧城市等场景。利用 YOLOv8 的高效架构,在保持实时性的同时,有效应对小目标、遮挡、密集人群等挑战。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/29 2:02:22

BiliTools终极指南:2026年最完整的B站资源下载解决方案

BiliTools终极指南:2026年最完整的B站资源下载解决方案 【免费下载链接】BiliTools A cross-platform bilibili toolbox. 跨平台哔哩哔哩工具箱,支持视频、音乐、番剧、课程下载……持续更新 项目地址: https://gitcode.com/GitHub_Trending/bilit/Bil…

作者头像 李华
网站建设 2026/5/28 12:05:49

OCR识别云服务:基于CRNN的SaaS平台搭建

OCR识别云服务:基于CRNN的SaaS平台搭建 📖 项目背景与技术选型动因 在数字化转型加速的今天,OCR(光学字符识别)技术已成为信息自动化处理的核心工具之一。从发票报销、证件录入到文档归档,OCR能够将图像中的…

作者头像 李华
网站建设 2026/5/30 19:32:24

双倍效率:Z-Image-Turbo+OpenVINO云端加速全攻略

双倍效率:Z-Image-TurboOpenVINO云端加速全攻略 如果你是一名算法工程师,正在为Z-Image-Turbo在Intel平台上的推理速度优化而头疼,那么这篇文章正是为你准备的。我们将详细介绍如何利用预集成OpenVINO的优化环境,跳过繁琐的交叉编…

作者头像 李华
网站建设 2026/5/30 19:32:08

一键切换:用阿里通义Z-Image-Turbo WebUI快速比较不同风格模型

一键切换:用阿里通义Z-Image-Turbo WebUI快速比较不同风格模型 作为一名艺术研究者,你是否经常需要对比不同AI模型生成的艺术风格差异?传统方法每次切换模型都需要复杂的配置过程,从安装依赖到调整参数,耗时又费力。今…

作者头像 李华
网站建设 2026/5/29 21:33:24

文字秒变CAD图纸:AI设计工具让机械制图零门槛

文字秒变CAD图纸:AI设计工具让机械制图零门槛 【免费下载链接】text-to-cad-ui A lightweight UI for interfacing with the Zoo text-to-cad API, built with SvelteKit. 项目地址: https://gitcode.com/gh_mirrors/te/text-to-cad-ui 还在为复杂的CAD软件操…

作者头像 李华
网站建设 2026/5/29 19:11:26

HTML lang属性识别?OCR镜像可提取网页快照中的多语言文本

HTML lang属性识别?OCR镜像可提取网页快照中的多语言文本 📖 项目简介 在现代Web应用与自动化数据采集场景中,从图像中精准提取结构化文本信息已成为一项关键能力。尤其在处理包含多语言内容的网页快照、截图或扫描文档时,传统方法…

作者头像 李华