news 2026/5/15 11:28:33

智慧农业-棉田昆虫检测数据集 棉花虫害检测数据集 常见的害虫(如棉铃虫),还包含了多种益虫和天敌(如瓢虫、草蛉)YOLOV8模型如何训练棉花叶片虫害检测数据集

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
智慧农业-棉田昆虫检测数据集 棉花虫害检测数据集 常见的害虫(如棉铃虫),还包含了多种益虫和天敌(如瓢虫、草蛉)YOLOV8模型如何训练棉花叶片虫害检测数据集

智慧农业-棉田昆虫检测数据集】YOLO格式|13类农业检测|3225张高清图片

​数据集亮点:
① ​3225张棉田昆虫高清图片
② ​TXT/XML双格式标注,兼容YOLO等主流框架
③ ​13类昆虫检测,涵盖害虫与益虫

​应用场景

  1. ​虫害监测:实时识别棉铃虫、盲蝽等害虫,及时预警
  2. ​生物防治:统计益虫(瓢虫、草蛉等),优化生态防控策略
  3. ​精准施药:基于虫害分布图,减少农药滥用

​数据集规格:
①标注格式:TXT(YOLO格式) + XML(Pascal VOC格式)
②类别标签及中文意思:
0: bee —— 蜂
1: bollworm —— 棉铃虫
2: lacewing —— 草蛉
3: dy —— 多异瓢虫
4: hb —— 横斑瓢虫
5: lbq —— 菱斑巧瓢虫
6: ccc —— 茶翅蝽
7: hsy —— 黑食蚜盲蝽
8: lv —— 绿盲蝽
9: mc —— 牧草盲蝽
10: mx —— 苜蓿盲蝽
11: zh —— 中黑盲蝽
12: syrphid —— 食蚜蝇

③数据划分:
​训练集:2257张(70%)
​验证集:645张(20%)
​测试集:323张(10%)
数据来源:新疆主要棉产区实地拍摄


YOLOv8 训练代码

📊 棉田昆虫检测数据集规格表

属性详细说明
数据集名称棉田昆虫检测数据集
图片总数3225 张(高清实拍)
数据来源新疆主要棉产区实地拍摄
标注格式TXT (YOLO) + XML (Pascal VOC)
检测类别13 类(涵盖害虫与益虫)
数据划分训练集 (2257张, 70%)验证集 (645张, 20%)测试集 (323张, 10%)
🏷️ 类别标签映射表

在模型训练时,请确保class_id与以下中文含义对应:

ID英文标签中文含义生态角色
0bee授粉/益虫
1bollworm棉铃虫主要害虫
2lacewing草蛉捕食性益虫
3dy多异瓢虫捕食性益虫
4hb横斑瓢虫捕食性益虫
5lbq菱斑巧瓢虫捕食性益虫
6ccc茶翅蝽害虫
7hsy黑食蚜盲蝽害虫
8lv绿盲蝽害虫
9mc牧草盲蝽害虫
10mx苜蓿盲蝽害虫
11zh中黑盲蝽害虫
12syrphid食蚜蝇益虫

💻 YOLOv8 详细训练代码

为了保证训练的顺利进行,建议先将你的数据集整理成标准的 YOLO 目录结构:

cotton_insect_dataset/ ├── images/ │ ├── train/ (放入2257张训练图) │ ├── val/ (放入645张验证图) │ └── test/ (放入323张测试图) ├── labels/ │ ├── train/ (放入对应的txt标签) │ ├── val/ │ └── test/ └── cotton.yaml <-- 配置文件
第一步:创建配置文件cotton.yaml

在代码同级目录下新建此文件,填入以下内容:

path:./cotton_insect_dataset# 数据集根目录路径train:images/trainval:images/valtest:images/testnc:13# 类别数量# 13类昆虫名称,顺序必须与ID严格对应names:['bee','bollworm','lacewing','dy','hb','lbq','ccc','hsy','lv','mc','mx','zh','syrphid']
第二步:编写 Python 训练脚本train.py
fromultralyticsimportYOLOdeftrain_cotton_insect_model():# 1. 加载预训练模型# 推荐使用 yolov8n.pt (nano版),速度极快,适合部署在无人机或田间巡检设备上model=YOLO('yolov8n.pt')# 2. 开始训练results=model.train(data='cotton.yaml',# 指定数据配置文件epochs=150,# 训练轮数(棉田背景复杂,建议适当增加轮数)imgsz=640,# 输入图像尺寸batch=16,# 批次大小(根据你的显卡显存调整,如显存不足可改为8)device=0,# 使用GPU设备 (若有多个GPU可写为)workers=4,# 数据加载线程数project='Cotton_Insect_Detect',# 项目保存根目录name='exp_yolov8n_v1',# 实验名称patience=20,# 早停机制:若20轮指标无提升则自动停止optimizer='SGD',# 优化器(SGD在小数据集上通常收敛更稳)# --- 针对棉田场景的数据增强策略 ---hsv_h=0.015,# 色调增强(模拟不同光照下的棉田环境)hsv_s=0.7,# 饱和度增强hsv_v=0.4,# 明度增强degrees=10.0,# 随机旋转角度translate=0.1,# 平移变换scale=0.5,# 缩放增益(应对昆虫远近大小不一的情况)flipud=0.5,# 上下翻转概率(昆虫在叶片正反面均可能出现)fliplr=0.5,# 左右翻转概率mosaic=1.0,# Mosaic数据增强(极大提升小目标检测能力))[[source_group_web_1]]# 3. 验证模型性能 (在验证集上评估)metrics=model.val()print(f"各类别平均精度 mAP50-95:{metrics.box.map}")# 4. 导出模型 (可选,方便后续部署到移动端或边缘设备)# model.export(format='onnx', simplify=True)if__name__=='__main__':train_cotton_insect_model()

💡 核心亮点与建议

  1. 益虫与害虫兼顾:由于数据集中包含了大量瓢虫、草蛉等益虫,训练出的模型可以直接用于生物防治决策。例如,当系统检测到益虫密度较高时,可以推迟或减少农药喷洒,保护田间生态平衡。
  2. 应对复杂背景:棉田环境通常包含复杂的枝叶遮挡和多变的光照。代码中开启了mosaic=1.0和较强的色彩空间增强(HSV),这能有效帮助模型识别隐藏在叶片背面或阴影中的微小昆虫(如幼虫期的棉铃虫)。
  3. 双格式优势:你拥有 TXT 和 XML 双格式,如果后续想尝试 Faster R-CNN 或 SSD 等其他框架,可以直接调用 XML 标注,无需重新转换。

需要我帮你写一份基于训练好的模型进行推理的Python脚本吗?比如输入一张棉田图片,输出检测到的昆虫类别、坐标和置信度。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/15 11:26:49

保姆级教程:用Python+UWB雷达(X4M200模块)实现非接触式呼吸心跳监测

零基础玩转UWB雷达&#xff1a;Python实战呼吸心跳监测全流程解析 在智能健康监测领域&#xff0c;非接触式生命体征检测技术正掀起一场静默革命。想象一下&#xff0c;无需佩戴任何设备&#xff0c;仅需一个烟盒大小的雷达模块&#xff0c;就能在1米外精准捕捉你的呼吸频率和心…

作者头像 李华
网站建设 2026/5/15 11:26:47

ABAP高效提取CKM3成本数据的三种实战方案

1. 为什么需要从CKM3提取成本数据&#xff1f; 在SAP系统中&#xff0c;CKM3&#xff08;成本核算&#xff09;模块是企业成本管理的核心组件。它负责计算和存储物料的标准成本、实际成本以及差异分析数据。作为SAP顾问或开发人员&#xff0c;我们经常遇到这样的需求&#xff…

作者头像 李华
网站建设 2026/5/15 11:25:47

在 Taotoken 平台如何根据任务需求在模型广场进行快速选型

&#x1f680; 告别海外账号与网络限制&#xff01;稳定直连全球优质大模型&#xff0c;限时半价接入中。 &#x1f449; 点击领取海量免费额度 在 Taotoken 平台如何根据任务需求在模型广场进行快速选型 面对众多大模型&#xff0c;如何为你的具体任务挑选一个合适的模型&…

作者头像 李华
网站建设 2026/5/15 11:24:15

5个步骤轻松上手Mermaid图表编辑器:零代码创建专业图表

5个步骤轻松上手Mermaid图表编辑器&#xff1a;零代码创建专业图表 【免费下载链接】mermaid-live-editor Edit, preview and share mermaid charts/diagrams. New implementation of the live editor. 项目地址: https://gitcode.com/GitHub_Trending/me/mermaid-live-edito…

作者头像 李华