news 2026/4/18 0:48:45

裂缝分割数据集 4000张 ,4000张yolo格式的裂缝分割数据集 构建了一个基于 YOLOv5-seg 的裂缝分割系统 桥梁、道路、建筑等结构健康监测场景

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
裂缝分割数据集 4000张 ,4000张yolo格式的裂缝分割数据集 构建了一个基于 YOLOv5-seg 的裂缝分割系统 桥梁、道路、建筑等结构健康监测场景

yolov5-seg ,4000张yolo格式的裂缝分割数据

🛠️ 如何使用YOLOv5-seg训练 4000 张 YOLO 格式裂缝分割数据集(含 PR 曲线分析)

目标:使用 YOLOv5-seg 模型训练一个高精度的裂缝语义分割模型,支持 4000 张标注图像
任务类型:实例分割(Instance Segmentation)——识别并分割出图像中的裂缝区域
输出:完整训练流程、配置文件、代码示例、PR曲线解读与优化建议


🔧 一、环境准备

# 创建虚拟环境conda create -n yolov5_segpython=3.9-y conda activate yolov5_seg# 克隆官方 YOLOv5 仓库(含 segmentation 分支)gitclone https://github.com/ultralytics/yolov5.gitcdyolov5# 安装依赖pipinstall-r requirements.txt pipinstalltorch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu118

✅ 使用ultralytics/yolov5是推荐版本,已支持segment功能。


📁 二、数据集准备(YOLO 格式)

1. 数据结构要求

datasets/crack_segmentation/ ├── images/ │ ├── train/ # 2800 张训练图 │ └── val/ # 1200 张验证图 └── labels/ ├── train/ # 对应 .txt 文件 └── val/

2. YOLO 格式标签(.txt文件)

每行格式:

<class_id> <x_center> <y_center> <width> <height> <segmentation>
  • class_id: 0(裂缝类)
  • <x_center>, <y_center>: 边界框中心点(归一化)
  • <width>, <height>: 边界框宽高(归一化)
  • <segmentation>: 多边形顶点坐标(归一化),格式为:
    x1 y1 x2 y2 x3 y3 ... xn yn

💡 示例:labels/train/img_001.txt

0 0.45 0.62 0.2 0.3 0.4 0.6 0.5 0.6 0.55 0.7 0.5 0.7 0.55 0.6 0.5 0.5

✅ 建议使用LabelMeCVAT工具标注,再转换为 YOLO 格式。


📄 三、创建data.yaml

# data.yamlpath:./datasets/crack_segmentationtrain:images/trainval:images/val# number of classesnc:1names:['crack']

🎯 四、训练模型(train.py

# train.pyimportosimportsys sys.path.append('./')frommodels.experimentalimportattempt_loadfromutils.datasetsimportLoadImagesAndLabelsfromutils.generalimportcheck_file,check_img_sizefromutils.plotsimportplot_resultsfromutils.torch_utilsimportselect_device# 设置参数device='0'# GPU 编号batch_size=16imgsz=640epochs=100weights='yolov5s-seg.pt'# 预训练权重(可选)data='data.yaml'name='crack_segmentation'# 启动训练!python train.py \--batch-size{batch_size}\--epochs{epochs}\--img640\--data{data}\--weights{weights}\--name{name}\--device{device}\--workers4\--patience10\--save-period10\--project runs/segment \--exist-ok

✅ 输出路径:runs/segment/crack_segmentation/


📊 五、评估结果与 PR 曲线解读

你提供的Precision-Recall Curve(PR 曲线)显示:

特征解读
初始段接近 (0,1)在低召回率下,模型具有很高的精确度(误检少)
下降趋势平缓随着召回率提升,精确度下降较慢 → 模型鲁棒性强
在 Recall ~0.8 时 Precision ~0.7表明模型在保持较高召回的同时仍能维持良好精度

理想 PR 曲线特征

  • 越靠近左上角越好
  • AUC(曲线下面积)越高越好(>0.9 优秀)

❌ 若曲线陡降,说明模型存在大量误检或漏检。


🧪 六、推理测试(检测 + 分割)

# detect.pyimporttorchfrommodels.experimentalimportattempt_loadfromutils.datasetsimportLoadImagesfromutils.generalimportnon_max_suppression,scale_coordsfromutils.plotsimportplot_one_box,plot_masks# 加载模型model=attempt_load('runs/segment/crack_segmentation/weights/best.pt',map_location='cpu')model.eval()# 推理图片image_path='test.jpg'img=cv2.imread(image_path)img=cv2.cvtColor(img,cv2.COLOR_BGR2RGB)# 推理withtorch.no_grad():pred=model(torch.tensor(img).permute(2,0,1).float().unsqueeze(0)/255.0)[0]# NMSpred=non_max_suppression(pred,conf_thres=0.5,iou=0.45,classes=None,agnostic=False)# 可视化fordetinpred:iflen(det):for*xyxy,conf,clsindet:# 绘制边界框plot_one_box(xyxy,img,color=(0,255,0),label='crack')# 绘制掩码(mask)mask=det[0][...,5:]# 获取 maskplot_masks(img,mask,xyxy)

📈 七、如何提升性能?

1.数据增强

# train.py 中添加--mosaic0.5--mixup0.5--hsv_h0.015--hsv_s0.7--hsv_v0.4

2.调整学习率

--lr00.001# 初始学习率--warmup_epochs3

3.使用更大数据量

  • 当前 4000 张数据足够训练,但若想更高精度,建议扩充至 8000+ 张

4.模型选择

模型参数量精度推荐场景
yolov5s-seg移动端/边缘设备
yolov5m-seg平衡性能
yolov5l-seg很高服务器部署

📂 八、导出模型(ONNX / TensorRT)

# export_model.pyfrommodels.experimentalimportattempt_loadimporttorch model=attempt_load('runs/segment/crack_segmentation/weights/best.pt')model.export(format='onnx')# 导出 ONNXmodel.export(format='engine')# 导出 TensorRT(需 CUDA)

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/15 18:06:09

虚拟直播背景:M2FP实时人像分割应用

虚拟直播背景&#xff1a;M2FP实时人像分割应用 &#x1f4cc; 技术背景与应用场景 随着虚拟直播、远程会议和数字人技术的兴起&#xff0c;实时人像分割已成为构建沉浸式交互体验的核心能力之一。传统绿幕抠像依赖特定背景环境&#xff0c;而基于深度学习的人像语义分割技术则…

作者头像 李华
网站建设 2026/4/17 20:25:36

M2FP模型在医疗影像分析中的创新应用

M2FP模型在医疗影像分析中的创新应用 &#x1f9e9; M2FP 多人人体解析服务&#xff1a;从通用视觉到医疗场景的延伸 随着深度学习在计算机视觉领域的持续突破&#xff0c;语义分割技术正逐步从基础图像理解迈向高精度、细粒度的应用场景。其中&#xff0c;M2FP&#xff08;M…

作者头像 李华
网站建设 2026/4/16 18:29:43

M2FP模型优化:使用ONNX加速推理

M2FP模型优化&#xff1a;使用ONNX加速推理 &#x1f4d6; 项目背景与技术挑战 在当前计算机视觉应用中&#xff0c;多人人体解析&#xff08;Multi-person Human Parsing&#xff09;正成为智能服装推荐、虚拟试衣、人机交互等场景的核心支撑技术。M2FP&#xff08;Mask2Forme…

作者头像 李华
网站建设 2026/4/17 3:16:00

M2FP对发型变化的鲁棒性测试:染发/戴帽场景解析准确

M2FP对发型变化的鲁棒性测试&#xff1a;染发/戴帽场景解析准确 &#x1f9e9; M2FP 多人人体解析服务 在当前计算机视觉领域&#xff0c;人体语义解析&#xff08;Human Parsing&#xff09;作为图像理解的重要分支&#xff0c;广泛应用于虚拟试衣、智能安防、AR互动和人物编辑…

作者头像 李华
网站建设 2026/4/14 2:30:15

初学者也能成功部署:M2FP图文教程带你看懂每个操作步骤

初学者也能成功部署&#xff1a;M2FP图文教程带你看懂每个操作步骤 &#x1f9e9; M2FP 多人人体解析服务 在计算机视觉领域&#xff0c;人体解析&#xff08;Human Parsing&#xff09; 是一项关键的细粒度语义分割任务&#xff0c;旨在将图像中的人体分解为多个语义明确的身…

作者头像 李华
网站建设 2026/4/16 15:46:34

2026:当人工智能从屏幕走向街头,我们正在见证一场认知的重塑

如果你在2024年惊叹于视频生成的逼真&#xff0c;在2025年感慨于大模型的无处不在&#xff0c;那么刚刚拉开帷幕的2026年&#xff0c;正在用一种更为深沉且彻底的方式&#xff0c;推翻我们对科技的过往认知。在拉斯维加斯刚刚结束的CES 2026上&#xff0c;科技巨头们不再执着于…

作者头像 李华