news 2026/5/24 18:32:17

Labelme标注神器:5分钟学会VOC格式转换全攻略

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
Labelme标注神器:5分钟学会VOC格式转换全攻略

Labelme标注神器:5分钟学会VOC格式转换全攻略

【免费下载链接】labelmeImage Polygonal Annotation with Python (polygon, rectangle, circle, line, point and image-level flag annotation).项目地址: https://gitcode.com/gh_mirrors/la/labelme

还在为图像标注数据格式转换而烦恼吗?从Labelme标注的JSON文件到计算机视觉项目常用的VOC格式,使用labelme2voc.py工具可以轻松实现自动化转换。本文将从零开始,带你掌握Labelme到VOC格式转换的全部技巧,让你的数据预处理效率提升数倍。

准备工作与环境搭建

在开始转换之前,首先需要获取Labelme项目源码并安装相关依赖:

git clone https://gitcode.com/gh_mirrors/la/labelme cd labelme pip install -e .

项目提供了多个实用的转换工具,包括边界框检测、实例分割和语义分割等场景的转换脚本。核心文件包括:

  • 标注工具:labelme/app.py
  • 边界框转换脚本:examples/bbox_detection/labelme2voc.py
  • 实例分割转换脚本:examples/instance_segmentation/labelme2voc.py
  • 标签定义文件:examples/bbox_detection/labels.txt

实战演练:边界框检测数据转换

标注数据生成

首先使用Labelme对图像进行标注,生成JSON格式的标注文件:

labelme examples/bbox_detection/data_annotated --labels examples/bbox_detection/labels.txt --nodata --autosave

标注完成后,每个图像都会生成对应的JSON文件,这些文件包含了所有的标注信息。

一键转换到VOC格式

使用labelme2voc.py脚本进行格式转换:

python examples/bbox_detection/labelme2voc.py examples/bbox_detection/data_annotated examples/bbox_detection/data_dataset_voc --labels examples/bbox_detection/labels.txt

转换过程会自动创建VOC标准目录结构,包括:

  • JPEGImages:存储原始图像
  • Annotations:存储XML标注文件
  • AnnotationsVisualization:存储可视化结果

进阶应用:实例分割数据转换

对于更复杂的实例分割任务,项目提供了专门的转换工具:

python examples/instance_segmentation/labelme2voc.py examples/instance_segmentation/data_annotated examples/instance_segmentation/data_dataset_voc --labels examples/instance_segmentation/labels.txt

实例分割转换会生成更丰富的文件类型:

  • SegmentationClass:语义分割掩码
  • SegmentationObject:实例分割掩码
  • 对应的可视化文件和npy格式文件

转换结果展示与验证

转换完成后,可以通过对比原始图像和标注结果来验证转换效果:

图:原始图像(左)与边界框标注可视化(右)

常见问题解决方案

标签未定义错误

如果在转换过程中遇到"Label not found in labels.txt"错误,说明标注中使用了未在标签文件中定义的类别。解决方法是在labels.txt文件中添加对应的标签名称。

多边形标注被跳过

在边界框检测转换中,多边形标注会被自动跳过。如果需要进行分割任务,请使用对应的分割转换脚本。

中文标签显示问题

确保标签文件使用UTF-8编码,并在Labelme配置中设置合适的中文字体。

转换工具核心参数详解

labelme2voc.py提供了多种参数选项来满足不同需求:

  • --labels:指定标签定义文件路径
  • --noviz:禁用可视化结果生成
  • --nonpy:不生成npy格式掩码文件
  • --noobject:不生成实例分割相关文件

总结与最佳实践

通过本文的学习,你应该已经掌握了Labelme到VOC格式转换的全过程。关键要点包括:

  1. 确保标签文件与标注数据的一致性
  2. 根据任务类型选择合适的转换脚本
  3. 转换前备份原始标注数据
  4. 转换完成后仔细检查生成的文件

项目还提供了其他实用工具,如转换为COCO格式的labelme2coco.py脚本,以及视频标注转换工具,可以满足更多复杂场景的需求。

掌握这些工具的使用方法,将大大提升你的图像数据处理效率,为后续的模型训练打下坚实基础。

【免费下载链接】labelmeImage Polygonal Annotation with Python (polygon, rectangle, circle, line, point and image-level flag annotation).项目地址: https://gitcode.com/gh_mirrors/la/labelme

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/22 19:30:15

跨设备AI计算框架Exo:构建分布式智能集群的完整指南

在人工智能快速发展的今天,部署和运行大型AI模型已成为许多开发者和研究者的迫切需求。然而,传统部署方式往往需要昂贵的专业硬件,限制了普通用户的参与。Exo框架通过创新的分布式计算技术,让普通设备也能组成高性能AI集群&#x…

作者头像 李华
网站建设 2026/5/9 12:02:44

SimpRead插件系统:打造专属阅读体验的完整指南

SimpRead插件系统:打造专属阅读体验的完整指南 【免费下载链接】simpread 简悦 ( SimpRead ) - 让你瞬间进入沉浸式阅读的扩展 项目地址: https://gitcode.com/gh_mirrors/si/simpread SimpRead插件系统为用户提供了强大的功能扩展能力,让这款优秀…

作者头像 李华
网站建设 2026/5/9 9:55:38

UltraISO注册码最新版已过时?来尝试前沿的VoxCPM-1.5-TTS-WEB-UI语音技术

VoxCPM-1.5-TTS-WEB-UI:当语音合成走进人人可触的AI时代 在内容创作、无障碍服务和智能交互日益普及的今天,我们对“声音”的要求早已不再满足于机械朗读。无论是有声书主播希望用自己熟悉的声音讲述故事,还是视障用户期待更自然流畅的屏幕朗…

作者头像 李华
网站建设 2026/5/21 17:19:00

一键部署VoxCPM-1.5-TTS-WEB-UI文本转语音模型,支持6006端口网页推理

一键部署VoxCPM-1.5-TTS-WEB-UI文本转语音模型,支持6006端口网页推理 在智能语音内容爆发的今天,越来越多的产品需要“开口说话”——从有声读物、AI主播到企业客服系统,高质量的文本转语音(TTS)能力正成为标配。但现实…

作者头像 李华
网站建设 2026/5/23 7:33:28

VoxCPM-1.5-TTS-WEB-UI能否用于机场航班信息播报?

VoxCPM-1.5-TTS-WEB-UI能否用于机场航班信息播报? 在现代机场的嘈杂环境中,一条关键广播——“南方航空CZ3581航班开始登机”——如果因为语音模糊、音质低劣或延迟过长而被旅客错过,可能直接导致误机。传统预录广播系统早已难以应对日益复杂…

作者头像 李华
网站建设 2026/5/25 4:32:13

5分钟搞定open_clip:零基础部署多模态AI的完整指南

5分钟搞定open_clip:零基础部署多模态AI的完整指南 【免费下载链接】open_clip An open source implementation of CLIP. 项目地址: https://gitcode.com/GitHub_Trending/op/open_clip 在当今AI技术飞速发展的时代,多模态人工智能已成为企业数字…

作者头像 李华