news 2026/6/6 20:15:39

Synapse腹部CT多器官分割数据集png图片+掩码图片+颜色映射表

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
Synapse腹部CT多器官分割数据集png图片+掩码图片+颜色映射表

医学图像多器官分割数据集

数据集概述

本数据集为医学图像语义分割数据集,包含来自18 个病例的共2,211 张切片图像及其对应的分割掩码,适用于多器官/多结构自动分割任务的训练与评估。
原图:

掩码图像:

掩码图像RGB格式:


基本信息

属性
总图像数2,211 张
病例数18 个
图像分辨率512 × 512 像素
图像格式PNG
图像类型灰度图(8-bit,单通道)
分割类别数8 类(含背景)
训练集1,658 张(75%)
测试集553 张(25%)

目录结构

data/ ├── images/ # 原始灰度图像(2,211 张) ├── masks/ # 标签掩码 - 索引格式(2,211 张,单通道,像素值 0-7) ├── masks_rgb/ # 标签掩码 - RGB 可视化格式(2,211 张,三通道彩色图) ├── color_map.txt # 类别颜色映射表 ├── train.txt # 训练集文件列表 ├── test.txt # 测试集文件列表

文件命名规范

文件命名格式为:case{病例编号}_slice{切片编号}.png

  • 病例编号:4 位数字(如00050040
  • 切片编号:3 位数字(如000142

示例:case0006_slice109.png表示第 6 号病例的第 109 张切片。


病例分布

病例切片数病例切片数
case0005117case0026131
case0006131case002788
case0007163case002889
case0009149case0030153
case0010148case003193
case0021143case0033104
case002396case003498
case0024124case003799
case003990
case0040195

分割标签与颜色映射

数据集包含 8 个分割类别,标签定义及颜色映射如下:

标签值颜色RGB 值说明
0⬛ 黑色(0, 0, 0)背景
1⬜ 白色(255, 255, 255)类别 1
2🟥 红色(0, 0, 255)类别 2
3🟩 绿色(0, 255, 0)类别 3
4🟦 蓝色(255, 0, 0)类别 4
5🟨 黄色(0, 255, 255)类别 5
6🟪 紫色(255, 0, 255)类别 6
7🩵 青色(255, 255, 0)类别 7

注意color_map.txt中的 RGB 值采用 OpenCV 的 BGR 格式。


掩码文件格式

数据集提供两种掩码格式:

masks/— 索引格式

  • 格式:单通道灰度图(Mode:L
  • 像素值:0–7,对应上表中的标签值
  • 用途:直接用于模型训练,可作为交叉熵损失等标准分割损失的输入

masks_rgb/— RGB 可视化格式

  • 格式:三通道彩色图(Mode:RGB
  • 像素值:按颜色映射表着色
  • 用途:可视化展示、结果对比、论文插图

数据集划分

数据集已预先划分好训练集与测试集:

  • train.txt:1,658 个文件名,每行一个,用于模型训练
  • test.txt:553 个文件名,每行一个,用于模型评估

文件列表中的文件名为images/目录下的文件名,对应的掩码文件在masks/masks_rgb/目录中具有相同的文件名。


类别分布(不均衡)

各标签在掩码中的像素占比存在明显不均衡:

标签近似像素占比
0(背景)~92%
5~1.8%
4~0.25%
3~0.19%
7~0.29%
1~0.15%
6~0.10%
2~0.06%

建议在训练时采用加权损失函数(如 Weighted Cross-Entropy、Dice Loss 或 Focal Loss)来缓解类别不均衡问题。


使用示例

PyTorch Dataset 示例

importosimporttorchimportnumpyasnpfromPILimportImagefromtorch.utils.dataimportDatasetclassSegmentationDataset(Dataset):def__init__(self,root_dir,split='train',transform=None):self.root_dir=root_dir self.transform=transform self.split=split# 读取文件列表list_file=os.path.join(root_dir,f'{split}.txt')withopen(list_file,'r')asf:self.filenames=[line.strip()forlineinfifline.strip()]def__len__(self):returnlen(self.filenames)def__getitem__(self,idx):fname=self.filenames[idx]# 读取图像和掩码image=Image.open(os.path.join(self.root_dir,'images',fname))mask=Image.open(os.path.join(self.root_dir,'masks',fname))image=np.array(image)mask=np.array(mask)# 像素值 0-7ifself.transform:image,mask=self.transform(image,mask)else:image=torch.from_numpy(image).unsqueeze(0).float()/255.0mask=torch.from_numpy(mask).long()returnimage,mask# 使用dataset=SegmentationDataset('path/to/data',split='train')

可视化掩码示例

importmatplotlib.pyplotaspltfromPILimportImage# 读取原始图像和 RGB 掩码image=Image.open('images/case0006_slice109.png')mask_rgb=Image.open('masks_rgb/case0006_slice109.png')fig,axes=plt.subplots(1,2,figsize=(10,5))axes[0].imshow(image,cmap='gray')axes[0].set_title('原始图像')axes[0].axis('off')axes[1].imshow(mask_rgb)axes[1].set_title('分割掩码(RGB)')axes[1].axis('off')plt.tight_layout()plt.show()

注意事项

  1. 像素值范围:原始图像为 8-bit 灰度图,像素值范围 [0, 255],输入模型前建议归一化至 [0, 1]
  2. 类别不均衡:背景像素占约 92%,前景类别占比很小,请采用适当的损失函数或数据增强策略
  3. 数据划分:训练集与测试集已固定划分,请勿混用以保证实验公平性
  4. 掩码使用:训练时请使用masks/目录下的索引格式掩码,masks_rgb/仅供可视化使用
    数据集地址:https://download.csdn.net/download/FL1623863129/90010785
版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/6 20:15:32

基于Proteus与uC/OS-II的ARM7驱动仿真验证平台搭建与实践

1. 项目概述:在Proteus中搭建ARM7uC/OS-II的驱动验证平台作为一名在嵌入式领域摸爬滚打了十多年的老工程师,我始终认为,脱离硬件环境的纯软件调试,就像在陆地上学游泳,理论再扎实,下水那一刻也可能手忙脚乱…

作者头像 李华
网站建设 2026/6/6 20:14:19

信奥赛C++提高组csp-s之搜索进阶(记忆化搜索案例实践3)

信奥赛C提高组csp-s之搜索进阶(记忆化搜索案例实践3) 方格取数 题目描述 设有 nmn \times mnm 的方格图,每个方格中都有一个整数。现有一只小熊,想从图的左上角走到右下角,每一步只能向上、向下或向右走一格&#xf…

作者头像 李华
网站建设 2026/6/6 20:08:38

Python优化TVA实时数据流水线

重磅预告:本专栏将独家连载系列丛书《AI智能体视觉技术与应用》部分精华内容,该书是世界首套系统阐述“因式智能体”视觉理论与实践的专著,特邀美国 TypeOne 公司首席科学家、斯坦福大学博士 Bohan 担任技术顾问。Bohan先生师从美国三院院士、…

作者头像 李华
网站建设 2026/6/6 20:04:57

如何彻底掌握IDM试用期管理:3种创新方法实现永久下载体验

如何彻底掌握IDM试用期管理:3种创新方法实现永久下载体验 【免费下载链接】IDM-Activation-Script IDM Activation & Trail Reset Script 项目地址: https://gitcode.com/gh_mirrors/id/IDM-Activation-Script 还在为Internet Download Manager的试用期限…

作者头像 李华
网站建设 2026/6/6 20:03:59

贪心算法-背包问题

#include<stdio.h> #define N 5 //物品数量(总类) #define W 100 //容量 int v_temp[N1], w_temp[N1]; // 物品价值数组&#xff0c;物品容量数组 double vw_temp[N1];//单位物品价值容量数组 double answer[N1] {0};//解方案数组 void show(int v[],int w[],double …

作者头像 李华