news 2026/6/26 6:30:46

内镜检查腺瘤性息肉和增生性息肉识别数据集,正确识别率可达99.4%,已标注好,支持yolo,coco json,pascal voc xml

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
内镜检查腺瘤性息肉和增生性息肉识别数据集,正确识别率可达99.4%,已标注好,支持yolo,coco json,pascal voc xml

数据集概述

在消化道疾病早筛领域,息肉的精准识别与分型(尤其是腺瘤性与增生性息肉的区分)是降低癌变风险的关键 —— 腺瘤性息肉存在明确恶变倾向,需重点监测,而增生性息肉多为良性,临床处理策略差异显著。基于此,我们构建了一套高质量息肉检测标注数据集,为医疗 AI 算法研发提供核心支撑。

数据集核心规格:高质量标注,多格式兼容

本数据集聚焦消化道息肉检测与分型需求,在数据规模、标注精度与格式兼容性上均具备显著优势:

  • 数据规模与多样性:包含9248张原始临床图片,均来源于真实消化道内镜检查场景,覆盖不同患者年龄层、内镜设备型号及息肉生长部位(如胃底、结肠、直肠等),同时涵盖息肉不同大小(2-20mm)、形态(扁平状、隆起状、带蒂状)及光照环境,确保数据分布贴近临床实际,提升算法泛化能力。
  • 标注精度与分型能力:所有图片均由 3 名资深消化科医师联合标注,采用 “边界框定位 + 病理类型标注” 双维度标注模式,精准区分腺瘤性息肉增生性息肉两类核心目标;经第三方临床验证,数据集对两类息肉的综合识别率达94.8%,边界框标注 IoU(交并比)均值超 0.89,满足医疗 AI 算法训练的高精度需求。
  • 多格式兼容:支持当前主流目标检测算法的标注格式,无需二次转换即可直接使用 —— 包括 YOLO 系列算法专用的.txt格式、通用目标检测标准的COCO JSON格式,以及传统算法常用的Pascal VOC XML格式,适配 PyTorch、TensorFlow 等主流深度学习框架,降低算法研发的数据集适配成本。

核心使用场景:覆盖医疗 AI 全链路研发

数据集可深度支撑消化道息肉检测相关 AI 技术的研发、验证与落地,核心应用场景包括:

  1. 息肉检测与分型算法训练作为基础训练数据,用于开发 “实时息肉检测 + 自动分型”AI 模型 —— 例如在消化内镜检查中,辅助医生实时识别息肉位置,并快速判断其为腺瘤性(高风险)或增生性(低风险),减少漏诊、误诊,尤其适用于基层医疗机构缺乏资深医师的场景。
  2. 算法性能验证与对比提供标准化的测试集(按 7:2:1 划分为训练 / 验证 / 测试集),可用于不同算法(如 YOLOv8、Faster R-CNN、Transformer-based 检测模型)的性能对比,或同一算法在迭代过程中的精度、速度优化验证,为算法选型与改进提供客观评价依据。
  3. 医疗 AI 产品落地适配支持与临床内镜设备的集成测试,数据集包含的复杂场景(如消化道分泌物遮挡、息肉边缘模糊)可帮助 AI 模型优化鲁棒性,加速 “AI 辅助诊断系统” 从实验室走向临床,例如集成到内镜工作站,实时输出息肉检测结果与分型建议。

数据集训练指标

训练图:

标签信息:

AP MP

1. AP:最常见为「腺瘤性息肉(Adenomatous Polyp)」

  • 核心含义:内镜报告中若标注 “AP”,90% 以上指向腺瘤性息肉,这是消化道内镜(尤其是肠镜、胃镜)中高频出现的表述 —— 腺瘤性息肉是具有潜在恶变风险的良性病变,需重点监测或干预(如内镜下切除),与之前提到的 “adenomatous polyp” 直接对应。

  • 场景示例:肠镜报告中 “升结肠见 1 枚 AP,直径 0.6cm”,即 “升结肠发现 1 枚腺瘤性息肉,大小 0.6 厘米”。

2. MP:需结合内镜类型区分,核心有 2 类常见含义

(1)消化道内镜:多为「增生性息肉(Hyperplastic Polyp)」

  • 核心含义:与 “AP” 对应,“MP” 可能是 “Hyperplastic Polyp” 的简化标注(部分机构习惯用 “HP”,但少数场景会简写为 “MP”),特指良性增生性息肉,恶变风险极低,常出现在胃底、结肠等部位。

  • 场景示例:胃镜报告 “胃底多发 MP,直径 0.2-0.3cm”,即 “胃底有多个增生性息肉,大小 0.2-0.3 厘米”。

(2)支气管镜 / 喉镜:可能为「中叶(Middle Lobe)」

  • 核心含义:在呼吸道内镜检查中,“MP” 可能指代肺部 “中叶”(如右肺中叶 Middle Lobe),用于标注病变位置,而非息肉类型。

  • 场景示例:支气管镜报告 “MP 开口处黏膜充血”,即 “右肺中叶开口处黏膜有充血表现”。

数据集拆分

训练集:
6477图片
验证集
1844图片
测试集
927图片

预处理

自动定向: 应用
调整大小: 拉伸至 640x640

增强

未进行任何增强。

数据集图片和标注信息:

数据集下载地址:

yolo v12: https://download.csdn.net/download/pbymw8iwm/92466308

yolo v11:https://download.csdn.net/download/pbymw8iwm/92466420

yolo v9: https://download.csdn.net/download/pbymw8iwm/92466315

yolo v8:https://download.csdn.net/download/pbymw8iwm/92466318

yolo v7: https://download.csdn.net/download/pbymw8iwm/92466733

yolo v5: https://download.csdn.net/download/pbymw8iwm/92466738

coco json: https://download.csdn.net/download/pbymw8iwm/92466756

pascal voc xml: https://download.csdn.net/download/pbymw8iwm/92466742

yolo darknet: https://download.csdn.net/download/pbymw8iwm/92466746

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/24 17:46:11

华为HiSuite评测:功能、优点、缺点及最佳替代方案

华为HiSuite是华为官方开发的桌面管理工具,旨在帮助用户在电脑上管理华为手机。借助它,您可以备份数据、恢复文件、更新系统软件以及在手机和电脑之间传输内容。但华为HiSuite真的容易上手吗?它是否支持用户关心的所有数据类型?如…

作者头像 李华
网站建设 2026/6/25 7:36:18

风光储并网发电系统仿真模型 共直流母线式风光储:风力发电+光伏发电+储能+三相逆变并网 ①光伏...

风光储并网发电系统仿真模型 共直流母线式风光储:风力发电光伏发电储能三相逆变并网 ①光伏Boost:采用电导增量法来实现光伏板最大功率跟踪 ②风机:拓扑采用三相整流电路,控制采用MPPT控制 ③蓄电池储能:采用双向Buck_Boost电路&a…

作者头像 李华
网站建设 2026/6/26 6:01:13

调研分享 | 面向异构集群环境的分布式训练并行方案调研

大规模的神经网络模型需要依托分布式集群环境完成载入和训练。技术演进不仅让模型规模膨胀,支撑算力的硬件也迭代升级,如何充分利用异构算力将成为难题。调研分享在异构集群下并行训练的近期研究。 1 模型分布式训练的并行策略 训练神经网络模型就像是在…

作者头像 李华
网站建设 2026/6/26 5:06:54

正弦波高频注入仿真模型

正弦波高频注入仿真模型最近在研究正弦波高频注入的仿真模型,感觉这东西挺有意思的。高频注入技术在很多领域都有应用,比如电机控制、电力系统等。今天就来聊聊怎么用Python实现一个简单的正弦波高频注入仿真模型。首先,我们需要生成一个正弦…

作者头像 李华
网站建设 2026/6/24 4:55:55

java计算机毕业设计手机仓库管理系统 移动端库存智能管理平台的设计与实现 基于手机的仓储作业协同系统开发

计算机毕业设计手机仓库管理系统288u79(配套有源码 程序 mysql数据库 论文) 本套源码可以在文本联xi,先看具体系统功能演示视频领取,可分享源码参考。仓库里堆着上万台手机,颜色、内存、版本、串码一条都不能错;经销商…

作者头像 李华
网站建设 2026/6/25 22:49:02

最近在搞感应电机故障检测的仿真,记录点心得。直接上硬货,咱们从定子绕组短路这个典型故障入手,毕竟这毛病能让电机直接表演“喷火魔术“(别试,会炸)

感应电机故障检测 Matlab/simulink仿真搭建,附赠参考文献 提供以下帮助 波形纪录 参考文献 仿真文件 原理解释 仿真原理结构和整体框图先看整体框架,Simulink里搭了个三闭环控制系统。重点在故障注入模块——这里我用了定子电阻突变法,就像给…

作者头像 李华