news 2026/6/2 7:46:21

102.多目标跟踪(MOT)基础:SORT、DeepSORT算法原理

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
102.多目标跟踪(MOT)基础:SORT、DeepSORT算法原理

上周调一个车载摄像头项目,客户抱怨夜间场景下车辆ID频繁跳变——明明同一辆车,帧间稍微遮挡一下,ID就从12跳成了37,后处理模块直接崩了。打开跟踪器输出日志一看,好家伙,IOU匹配在低照度抖动视频里根本稳不住。这问题把我直接拽回了多目标跟踪这个老战场,今天咱们就拆解下两个经典算法SORT和DeepSORT,都是实战里真刀真枪踩出来的认知。

SORT:简单到极致就是美

先看SORT(Simple Online and Realtime Tracking),2016年的工作,核心思想就俩字:利落。算法四步走:检测→预测→匹配→更新。检测器用当时最强的Faster R-CNN,跟踪部分却朴素得惊人——卡尔曼滤波预测边界框位置,匈牙利算法做IOU匹配。

卡尔曼滤波这里有个细节容易栽跟头:状态向量选的是[x,y,a,h,vx,vy,va,vh],其中a是宽高比,h是高度。为什么用宽高比而不是宽度?因为实际场景中物体宽度变化比高度剧烈,用宽高比更稳定。但注意了,如果检测框本身质量差,这个假设会崩,我们吃过亏。

匹配阶段用IOU矩阵+匈牙利算法,阈值通常设0.3。这里有个坑:相邻帧间目标运动不能太大,否则IOU直接掉到阈值以下,跟丢。所以SORT对帧率敏感,30fps下表现还行,降到15fps跟踪碎片化就明显了。

SORT最大的特点是“短记忆”——没有重识别机制,遮挡超过一帧基本就丢。但它的速度是真快,260Hz的跟踪速度至今仍有竞争力。我们项目里在算力受限的嵌入式平台还用着SORT的变种,秘诀是把检测频率降到跟踪频率的1/3,中间帧纯靠卡尔曼推,省出一半算力。

DeepSORT:给SORT装上记忆模块

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/2 7:39:09

解决YOLOv8转RKNN精度暴跌问题:深入分析ONNX输出节点与量化陷阱

YOLOv8模型RKNN转换精度优化实战:从算子解析到内存布局调优当我们将训练好的YOLOv8模型部署到Rockchip NPU平台时,从ONNX到RKNN的转换过程往往伴随着令人头疼的精度下降问题。本文将从底层原理出发,结合RKNN量化特性和NPU硬件架构&#xff0c…

作者头像 李华