news 2026/4/19 4:34:13

CVAT(Computer Vision Annotation Tool)计算机视觉数据标注工具

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
CVAT(Computer Vision Annotation Tool)计算机视觉数据标注工具

文章目录

    • 一、CVAT 简介与核心特性
      • 1. 基本信息
      • 2. 主要功能
      • 3. 使用方式(简要)
    • 二、类似工具对比
    • 三、选型建议

CVAT(Computer Vision Annotation Tool)是一款由 Intel 开发并开源的、功能强大的计算机视觉数据标注工具,支持图像和视频的2D/3D 标注,广泛应用于目标检测、实例分割、关键点标注、动作识别等任务。


一、CVAT 简介与核心特性

1. 基本信息

  • 官网:https://cvat.org
  • 开源地址:https://github.com/cvat-ai/cvat
  • 许可证:MIT(自 v2.0 起)
  • 部署方式:支持 Docker 本地部署、云部署(如 CVAT.ai 托管版本)

2. 主要功能

  • 支持标注类型
    • 矩形框(Bounding Box)
    • 多边形(Polygon)
    • 折线(Polyline)
    • 关键点(Points / Skeletons)
    • 语义/实例分割(Masks via polygons or brush)
    • 跟踪(Interpolation across video frames)
    • 3D 点云标注(需集成 Sensor Fusion)
  • 协作功能
    • 多用户协作(项目权限管理、任务分配)
    • 审核工作流(annotator → reviewer)
  • 自动化辅助
    • 集成 AI 模型(如 Auto-Annotation 功能,可接入 OpenVINO、TensorFlow、PyTorch 模型)
    • 支持 SAM(Segment Anything)、YOLO 等预训练模型辅助标注
  • 数据格式支持
    • 导入:Images, Videos, ZIP, Image folders, YouTube 链接等
    • 导出:COCO, Pascal VOC, YOLO, TFRecord, MOT, LabelMe, Datumaro 等

3. 使用方式(简要)

  1. 本地部署(推荐 Docker)

    gitclone https://github.com/cvat-ai/cvatcdcvat docker-compose up -d

    默认访问http://localhost:8080

  2. 创建项目 → 上传数据 → 创建任务 → 标注 → 导出

  3. AI 辅助标注

    • 在任务中启用 “Automatic Annotation” 模型(需先配置模型仓库)
    • 或使用 “Interactive Annotation”(如用 SAM 点选分割)

二、类似工具对比

工具类型开源多人协作视频标注AI 辅助3D/点云部署难度适合场景
CVATWeb✅(强)✅(强)✅(需配置)工业级、研究、团队协作
LabelMe桌面/Web小规模图像分割/多边形
VIA (VGG Image Annotator)Web(单文件 HTML)有限极低快速原型、教学
AnyLabeling桌面(Qt)✅(YOLO, SAM, GroundingDINO 等)个人使用、AI 辅助强
Roboflow AnnotateWeb(SaaS)无(云端)快速上手、中小项目
SuperAnnotateWeb(SaaS)企业级、高精度需求
Label StudioWeb✅(需配置)✅(通过 ML backend)有限多模态(文本/音频/图像)
Docker Annotator / RectLabel(Mac)桌面❌(RectLabel)有限个人、Mac 用户

特别说明

  • AnyLabeling:如果你偏好桌面应用、且重视本地 AI 模型辅助(如实时 SAM 分割),它是 CVAT 的轻量级替代。
  • Label Studio:如果你需要标注多模态数据(如图文对、语音+文本),它更灵活。
  • CVAT视频时序标注、团队协作、格式兼容性上综合优势明显。

三、选型建议

  • 科研/工业级项目、需视频跟踪、多人协作CVAT
  • 个人快速标注 + AI 辅助 + 无需部署AnyLabeling
  • 纯图像、小数据集、教学演示LabelMeVIA
  • 多模态(含文本、音频)Label Studio
  • 企业级、高精度、不想运维Roboflow / SuperAnnotate(付费)
版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!