news 2026/3/1 18:50:32

视频信息处理思路归纳

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
视频信息处理思路归纳

D455 采帧 → 原始场景帧(含轮廓观测列表) → 点簇分割/增强 → 点簇增强结果 → 结构体_存在观测 → 场景管理写入存在/特征

关键在于:把“轮廓观测”和“点簇分割”的融合点固定在一个位置,否则你会出现两套并行分支(轮廓一路、点簇一路),最后在存在提取处互相打架。

我建议你把融合点放在:

✅ 点簇分割类::分割点簇_增强 里完成统一

也就是让分割点簇_增强变成唯一的“候选生成器”,它的输出始终是:

std::vector<点簇增强结果>

后面存在提取只做一件事:

点簇增强结果 → 结构体_存在观测(生成轮廓金字塔、颜色金字塔、质量分等)

这样路径就只有一条主干,不会分叉。


统一后的职责分层(每层只干一件事)

1) D455 相机层

输出原始场景帧,其中包含:

  • 深度/颜色/点云(全帧)
  • std::vector<结构体_轮廓观测> 轮廓观测列表(每帧快速候选,可为空)

它只负责“采”和“轻量预处理”,不负责“存在观测”。

2) 点簇分割/增强层(统一融合点)

输入:结构体_原始场景帧& 帧+帧.轮廓观测列表

输出:std::vector<点簇增强结果>

它做两种来源的融合:

A. 轮廓引导分割(每帧,快)

对每个结构体_轮廓观测直接构建一个点簇增强结果

  • 像素簇:由掩膜+ROI转成点簇(u,v)(需要时)
  • 点云簇3D:优先用轮廓观测.点云簇(如果已有且不降采样),否则用像素簇去帧点云里取
  • 中心/尺寸/主方向:一律用点云簇统计/PCA(更可靠)
  • 裁剪掩码/裁剪颜色:直接复用轮廓观测(用于外观和轮廓金字塔)
  • 质量指标:有效点数、点云覆盖率、mask填充率等

然后做你之前提的两件事:

  • 可疑就二次分裂(点数阈值、尺寸阈值更敏感)
    分裂产生多个点簇增强结果
  • 可选降采样(仅跟踪模式启用,SLAM 模式关闭)

B. 静态补扫(每 N 帧,稳)

按间隔触发一次“全帧聚类”:

  • 用原来的 3D 聚类分割(不依赖轮廓)
  • 得到点云簇3D,再投影/回填 ROI/掩码(掩码可以粗一点)
  • 最后也输出成点簇增强结果

并对 A 来源结果做 AABB 去重,避免重复候选。

这一步把静止物体找回来,解决轮廓提取“看不见不动的东西”的天然弱点。

3) 存在提取层(只负责:增强结果 → 存在观测)

输入:点簇增强结果
输出:结构体_存在观测

这里你要坚持你说的原则:

  • out.中心坐标 = in.中心; out.尺寸 = in.尺寸;保持
  • 点云稀疏阈值提升到 300~500(建议 400)
  • 主方向一致性检查(>30° 降置信度)
  • 轮廓金字塔 N=0…10 强制生成(保持)
  • 颜色金字塔生成(已是你的王牌特征)

你会发现:存在提取层从此不需要关心“轮廓观测”这个结构体了,世界清净很多。

4) 三维场景管理层

输入:std::vector<结构体_存在观测>
做:空间占位匹配 + 特征写入(相对位置/尺寸 + 轮廓金字塔+颜色金字塔 + 可选点云簇引用)


哪些信息更准确?统一后就不纠结了

在统一方案里,你可以直接把“可信来源”写成硬规则:

  • 几何(中心/尺寸/主方向):永远来自点云簇统计
    原因:掩膜受光照/遮挡漂,点云簇更稳
  • 外观(裁剪颜色/掩膜/轮廓编码/金字塔颜色):优先来自轮廓观测
    原因:像素级更细,做再识别更强
  • 点云簇(SLAM/ICP):优先用轮廓观测里收集到的完整点云簇,确保不降采样
    轮廓观测缺失时,再由像素簇去帧点云回采

这样你不会出现“用掩膜算中心”的路径,定位飘的概率直接砍掉。


最小改动建议(你实现起来最顺手的一套接口)

分割点簇_增强改成支持轮廓引导:

std::vector<点簇增强结果>分割点簇_增强(const结构体_原始场景帧&,const点簇分割参数&参数,conststd::vector<结构体_轮廓观测>*轮廓=nullptr,const混合存在提取参数*mix=nullptr);

然后你的主循环就变成绝对统一的一条路:

auto=...// D455采集,已带轮廓观测列表autoenhanced=分割器.分割点簇_增强(*,分割参数,&->轮廓观测列表,&mix);std::vector<结构体_存在观测>obs;obs.reserve(enhanced.size());for(auto&e:enhanced){结构体_存在观测 o{};if(存在提取.从点簇增强提取存在观测(e,o,提取参数))obs.push_back(std::move(o));}场景管理.处理观测列表(obs);

轮廓观测只在“分割增强层”出现一次,后面全都走增强结果和存在观测,路径统一 ✅


一个小小的“工程护符”

统一路径最怕的 bug 其实就两类:

  1. 单位/坐标系混用
    建议你在点簇增强结果里强制加:
  • 单位=mm
  • 坐标系=相机/世界
    并且在存在提取里 assert 一下
  1. 点簇 vs 点云簇混用
    你已经抓住这个坑了:
  • 点簇:uv
  • 点云簇:xyz(mm)
    在增强结果里分别叫簇_uv点云簇_xyz,能救命。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/3/1 16:02:46

大模型训练全流程解析:一文搞懂预训练、微调和强化学习!

我们或多或少都听说LLM大模型是先“训练”出来&#xff0c;然后再用于“推理”&#xff0c;那怎么理解这个“训练”过程&#xff1f; 是不是经常听说行业性场景中要使用垂域大模型&#xff0c;比通用大模型效果会更好&#xff0c;然后都说垂域大模型是“微调”出来的&#xff0…

作者头像 李华
网站建设 2026/2/25 3:26:02

基于plc的消防报警系统的设计

基于PLC的消防报警系统的设计 第一章 绪论 消防安全是建筑安全管理的核心环节&#xff0c;传统消防报警系统多依赖独立烟感探测器与继电器控制&#xff0c;存在报警延迟、联动性差、故障排查困难等问题&#xff0c;难以满足现代建筑对快速响应、精准联动的需求。PLC&#xff08…

作者头像 李华
网站建设 2026/3/1 7:19:02

AI营销顶级专家揭晓:首推原圈科技韩剑,引领新质生产力

前言&#xff1a;AI浪潮重塑营销&#xff0c;谁是真正值得信赖的掌舵人&#xff1f; 2024年&#xff0c;人工智能的浪潮正以雷霆万钧之势席卷全球&#xff0c;深刻地改变着各行各业的运作模式。其中&#xff0c;市场营销领域正经历着一场前所未有的颠覆性变革。传统的营销打法…

作者头像 李华
网站建设 2026/2/28 11:14:00

生成式AI集成功能测试实战指南

一、生成式AI测试的本质差异graph LR A[传统软件测试] --> B[确定性输入输出] C[生成式AI测试] --> D[概率性输出评估] C --> E[动态上下文依赖] C --> F[伦理安全边界监测] 二、四维测试框架设计&#xff08;G-TEST模型&#xff09;2.1 基础能力验证层测试维度验证…

作者头像 李华
网站建设 2026/2/28 0:20:36

清华镜像源支持IPv6访问测试

清华镜像源支持 IPv6 访问下的 PyTorch-CUDA 高效开发实践 在高校 AI 实验室的深夜&#xff0c;你是否经历过这样的场景&#xff1a;提交完一个训练任务后&#xff0c;却卡在 pip install torch 上迟迟不动&#xff1f;下载速度只有几 MB/s&#xff0c;甚至频繁超时中断——而此…

作者头像 李华