YOLOFuse PR曲线导出技巧：论文绘图所需数据提取流程-开发者社区

YOLOFuse PR曲线导出技巧：论文绘图所需数据提取流程

在撰写目标检测方向的科研论文时，一张清晰、精确且风格统一的 PR（Precision-Recall）曲线图往往是评审专家关注的重点。尤其是在多模态场景下，如融合可见光与红外图像进行行人或车辆检测，模型性能的细微差异可能直接影响结论的可信度。而当我们使用像YOLOFuse这样基于 Ultralytics YOLO 构建的双流框架时，虽然训练过程流畅、推理高效，但默认输出中往往只包含可视化图像（如PR_curve.png），缺少可用于专业绘图软件（如 Matplotlib、OriginPro 或 Seaborn）的原始数值数据。

这带来了一个现实问题：我们能否避免“截图+描点”这种低效又失真的方式，直接从训练流程中精准提取 PR 曲线上的 (Precision, Recall) 数据点？答案是肯定的——关键在于深入理解 YOLOFuse 的评估机制，并巧妙利用其内部指标缓存结构。

Ultralytics 的metrics模块其实早已将这些数据以高分辨率数组的形式保存在内存中，只是未通过接口暴露出来。具体来说，在验证阶段结束后，系统会生成一个名为pr_curve的元组，其中包含了按类别划分的 precision 和 recall 序列。这个序列并非简单的插值结果，而是基于真实检测得分排序后统计得到的 1000 个采样点，再经 101 点插值得到 AP 值。因此，直接读取比事后重算更准确、更高效。

要获取这些数据，我们需要介入训练器（Trainer）对象的生命周期，在val()执行完成后访问其metrics属性。以下是一个经过实战验证的数据提取函数：

from ultralytics.utils.metrics import ConfusionMatrix, DetMetrics import numpy as np import json import os def extract_pr_curve_data(trainer): """ 从完成验证的 Trainer 实例中提取各类别的 PR 曲线原始数据 Args: trainer: 已执行 val() 的 Trainer 对象 Returns: pr_data: 字典格式，包含每个类别的 precision 和 recall 列表 """ metrics = trainer.metrics p = metrics['pr_curve'][0] # shape: [nc, 1000] r = metrics['pr_curve'][1] # shape: [nc, 1000] pr_data = {} class_names = trainer.data['names'] for i, name in enumerate(class_names): valid_mask = r[i] >= 0 # 排除填充点 precision_vals = p[i][valid_mask].tolist() recall_vals = r[i][valid_mask].tolist() pr_data[name] = { "precision": precision_vals, "recall": recall_vals } return pr_data

这段代码的核心逻辑并不复杂：它从trainer.metrics['pr_curve']中取出预计算的 precision 和 recall 数组，按类别遍历并过滤掉无效值（通常为负数填充），最终组织成标准 JSON 结构输出。你可以将其封装为回调函数，集成进你的train_dual.py主流程末尾：

if __name__ == "__main__": from train_dual import Trainer trainer = Trainer(cfg="cfg/default.yaml") trainer.train() trainer.val() # 必须先运行验证才能生成 metrics pr_result = extract_pr_curve_data(trainer) output_path = os.path.join(trainer.save_dir, "pr_curve_data.json") with open(output_path, 'w') as f: json.dump(pr_result, f, indent=2) print(f"PR曲线数据已成功导出至: {output_path}")

这样每次实验结束后都会自动生成一份可复用的数据文件，极大提升了后续分析效率。

当然，仅仅能提取数据还不够。真正决定论文图表质量的是如何呈现这些信息。比如，你可能希望对比不同融合策略下的性能差异——早期融合是否真的提升了低光照下的召回率？中期融合在保持轻量化的同时有没有牺牲关键类别的精度？

这时，原始数据的优势就显现出来了。假设你分别训练了early_fusion,mid_fusion,decision_fusion三个版本，只需将它们各自的pr_curve_data.json收集起来，用同一个绘图脚本统一渲染：

import matplotlib.pyplot as plt import json def plot_pr_curves_from_json(json_files, labels, title="PR Curves Comparison"): plt.figure(figsize=(9, 7)) for json_file, label in zip(json_files, labels): with open(json_file, 'r') as f: data = json.load(f) # 此处以第一个类别为例绘制（可根据需要扩展） cls_name = list(data.keys())[0] recall = data[cls_name]["recall"] precision = data[cls_name]["precision"] plt.plot(recall, precision, label=f"{label} - {cls_name}", linewidth=2) plt.xlabel("Recall", fontsize=12) plt.ylabel("Precision", fontsize=12) plt.title(title, fontsize=14) plt.legend(fontsize=11) plt.grid(True, linestyle='--', alpha=0.6) plt.xlim(0, 1) plt.ylim(0, 1) plt.savefig("pr_comparison.pdf", dpi=300, bbox_inches='tight') plt.show()

这样的做法不仅保证了坐标轴范围、字体大小、颜色风格的一致性，还能轻松支持消融实验的定量分析。更重要的是，所有图表都源于同一套原始数据源，避免了因手动处理导致的误差累积。

回到 YOLOFuse 本身的架构设计，它的灵活性也为这类研究提供了良好基础。该框架支持三种主流融合范式：

早期融合：将 RGB 与 IR 图像通道拼接（4通道输入），共享骨干网络。实现简单，但特征干扰风险较高；
中期融合：在 Neck 层（如 PANet）前对双流特征图进行加权融合或拼接，兼顾信息互补与参数效率；
决策级融合：两个分支独立预测，后处理阶段合并框并重新 NMS，容错性强但延迟略高。

根据 LLVIP 数据集上的实测表现，中期融合在精度与模型体积之间取得了最佳平衡——AP 提升明显，模型仅 2.61MB，非常适合部署于边缘设备。如果你正在优化夜间监控系统或无人机巡检方案，这种轻量高效的结构值得优先尝试。

其典型系统架构如下所示：

+------------------+ +------------------+ | RGB Images | | IR Images | | (images/) | | (imagesIR/) | +--------+---------+ +--------+---------+ | | v v +-------------------------------------------+ | Dual-Stream Backbone Network | | (e.g., CSPDarknet shared or separate) | +----------------------+--------------------+ | +---------v----------+ | Feature Fusion Module | | (Early/Mid/Decision Level) | +------------+-----------------+ | +---------v----------+ | Neck (PANet) | +---------+----------+ | +---------v----------+ | Detection Head | +---------+----------+ | +--------v--------+ | Output | | (xyxy, conf, cls)| +-----------------+

整个流程要求 RGB 与 IR 图像严格同名、同步加载，确保空间对齐。训练时可通过配置文件切换融合模式，推理时则由fusion_strategy参数控制前向传播路径。

实际应用中，研究人员常面临几个典型痛点：

论文需要高清矢量图，但只有 PNG 截图可用？
→ 解决方案：不要依赖日志图片！主动提取pr_curve数组，用 Python 或 Origin 绘制 PDF/SVG 格式输出。
多个实验配置难以横向对比？
→ 解决方案：建立标准化命名规则和输出目录结构，批量运行训练脚本并汇总 JSON 文件，实现一键对比绘图。
某类物体（如行人）召回率偏低，但无法定位原因？
→ 解决方案：单独分析该类别的 PR 曲线拐点位置，结合混淆矩阵查看误检类型，进而调整数据增强策略或损失权重。

为此，建议在工程实践中加入以下设计考量：

自动化保存：每次val()后自动导出pr_curve_data.json，纳入实验记录；
路径规范化：统一输出至runs/fuse/train/expX/目录，便于追踪；
非侵入式扩展：不修改 Ultralytics 源码，采用继承或装饰器方式封装提取逻辑；
脚本化实验管理：编写 shell 脚本循环执行不同 fusion_type 配置，提升迭代速度。

掌握 PR 曲线数据的提取方法，表面上看只是一个技术细节，实则是从“跑通模型”迈向“产出成果”的关键一步。它让我们不再局限于框架提供的默认图表，而是能够按照期刊要求定制视觉表达，增强论文的专业性和说服力。

更重要的是，这种能力赋予了我们对模型行为更深的理解。当你能精确看到某个类别的 recall 在 0.8 时 precision 急剧下降，你就有可能去排查是背景误检过多，还是小目标漏检严重。这种细粒度洞察，正是高水平科研工作的核心驱动力。

未来，随着多模态感知在自动驾驶、智能安防、工业巡检等领域的深入应用，类似 YOLOFuse 这样的融合框架将扮演越来越重要的角色。而谁能更好地挖掘其内在评估信号，谁就能更快地推动技术创新与落地转化。

YOLOFuse PR曲线导出技巧：论文绘图所需数据提取流程

YOLOFuse PR曲线导出技巧：论文绘图所需数据提取流程

YOLOFuse DomainNet大规模跨域测试

YOLOFuse infer_dual.py参数说明：自定义输入输出路径的方法

别再盲目写算子！掌握这3种C语言优化范式，性能直逼理论上限

【TinyML性能优化终极指南】：C语言推理加速的5大核心技术揭秘

YOLOFuse支持谷歌学术镜像网站参考文献检索？高效论文写作辅助

C语言实现磁力计硬铁/软铁校准：3步解决无人机航向漂移问题