news 2026/4/15 13:17:25

pd_process.c 文件源码分析

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
pd_process.c 文件源码分析

一 pd_process.c 是SVT-AV1编码器中的Picture Decision处理模块,主要功能包括

核心功能

1 图片决策上下文管理,创建和管理PD处理所需要的数据结构

--创建和销毁Picture Decision上下文

--管理图片决策过程中的各种数据结构和缓冲区

2 场景转换检测:使用直方图差异检测场景切换和突然变化

--检测视频序列中的场景切换

--检测突然变化(如闪光灯效果)

--使用直方图差异(AHD - Average Historgram Difference)进行检测

3 参考图片集管理:填充,统计信息收集等

--生成的管理参考图片集信息

--设置参考图片列表List0和List1

--处理参考图片的POC Picture Order Count 和显示顺序

4 图片预处理:填充,统计信息收集等

--图片填充(padding)到SuperBlock尺寸的倍数

--图片填充到最小块尺寸的倍数

--图片统计信息收集

5 Mini GOP管理:管理图片组的结构和配置

--管理Mini GOP的结构和配置

--处理Mini GOP内的图片顺序和依赖关系

--评估Mini GOP的活动度(Activity)

6 时域滤波处理:管理时域滤波相关的图片缓冲区

--管理时域滤波相关的图片缓冲区

--处理低延迟模式下的时域滤波

--多级时域滤波 MCTF

7 预测结构设置:根据配置设置预测结构

--根据编码配置设置预测结构

--支持多种预测结构:Flat, Hierarchical等

--设置关键帧 Key Frame, 和S帧 S-Frame

8 图片决策主循环:处理图片并发送到后续模块

--处理来自Picture Analysis的结果

--为每个图片设置编码参数

--将处理后的图片发送到后续处理阶段ME,TF等

9 屏幕内容检测

--检测输入内容是否为屏幕内容,Screen Content

-- 平米内容需要特殊的编码策略

10 自适应量化 Adaptive Quantization

-- 初始化循环刷新 Cycle Refresh

-- 管理AQ相关的参数

在编码流程中的位置

输入:来自Picture Analysis Porcess的结果

输出:发送到Motion Estimation和Temporal Filtering模块

关键数据结构

-PictureDecisionContext: 图片决策上下文,包含所有决策相关的状态信息

PictureParentControlSet: 图片父控制集,包含图片的所有编码参数

SequenceControlSet 序列控制集,包含序列级别的配置。

与其他模块的关系

输入:来自Picture Analysis Process的结果

输出:发送到Motion Estimation 和Temporal Filterting 模块

处理流程:

1 接收Picture Analysis 的结果

2 进行场景转换检测

3 设置预测结构和参考图片集

4 进行图片预处理和统计信息收集

5 管理Mini GOP结构

6 设置图片编码参数

7 发送到后续处理阶段

性能优化:

使用多线程处理

支持低延迟模式

支持多级时域滤波

支持自适应量化

/*

Defines 定义常量

层级偏移量定义,用于预测结构中的层级索引

这些偏移用于在分层预测结构中定位不同层级的图片

函数名:calc_ahd

功能:计算平均直方图差异,Average Histogram Difference, AHD

该函数用于场景转换检测,通过比较当前图片和参考图片的直方图差异来判断

场景是否发生变化,AHD值越大,表示两帧之间的差异越大

参数:

scs 序列控制集,包含序列级别的配置信息

input_pcs 输入图片的控制集,当前要分析的图片

ref_pcs: 参考图片的控制集,用于比较的参考图片

active_region_cnt 输出参数,统计活跃区域的数量。

ahd 计算得到的平均直方图差异值

算法说明:

1 将图片成多个区域

2 对每个区域,计算其直方图与参考图片对应区域直方图的差异

3 累加所有区域的差异值得到总的AHD

4 如果某个区域的差异超过阈值,则将其标记为活跃区域

*/

static uint32_t calc_ahd(

SequenceControlSet *scs, #序列控制集指针

PictureParentControlSet *input_pcs, #输入图片控制集指针

PictureParentControlSet *ref_pcs, #参考图片控制集指针

uint8_t *active_region_cnt #活跃区域计数指针

)

{

uint32_t ahd = 0;//初始化AHD值为0,用于累加所有区域的直方图差异

//计算每个区域的宽度和高度

//区域宽度 = 图片宽度 / 水平方向区域数量

uint32_t region_width = ref_pcs->enhance_pic->width / scs->picture_analysis_number_of_regions_per_width;

//区域高度=图片高度/垂直方向区域数量

uint32_tregion_height=ref_pcs->enhance_pic->height/scs->picture_analysis_number_of_regions_per_height;

//遍历图片所有区域

//外层循环遍历水平方向所有区域

for(int i = 0; i<width;i++)

for(int j = 0; j<height; j++){

uint32_tahd_per_region=0;

for(int bin = 0; bin < 255; bin++){

//计算当前区域指定bin直方图差异

//取绝对值,累加到当前区域AHD

ahd_per_region += ABS((int32_t)input_pcs->picture_histogram[region_in_picture_width_index][region_in_picture_height_index][bin] - (int32_t)ref_pcs->picture_histogram[region_in_picture_width_index][region_in_picture_height_index][bin]);

}

ahd+=ahd_per_region;//当前区域AHD累加AHD

//如果当前区域AHD超过阈值区域面积则认为活跃区域

//活跃区域表示区域发生显著变化

if(ahd_per_region > (region_width * region_height))

(*active_region_cnt)++;//增加活跃区域计算

}

}

returnahd;//返回计算得到ahd

}

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/13 23:44:54

LVGL9 双物理屏幕驱动入门教程

LVGL9 双物理屏幕驱动入门教程 下面以 C LVGL v9 为例&#xff0c;介绍如何在一个 MCU 上同时驱动两个独立的物理屏幕&#xff08;两个 lv_display_t&#xff09;&#xff0c;并在每个屏上加载自己的界面。示例代码严格按照工程中 lvgl__lvgl 组件&#xff08;LVGL v9 原生 AP…

作者头像 李华
网站建设 2026/4/8 13:12:52

MQTT网络传输协议巩固知识基础题(2)

1. MQTT 中的 Client ID 最大长度是多少? A. 64 字符 B. 128 字符 C. 256 字符 D. 没有限制 答案:D 解析: MQTT 协议规范没有明确规定 Client ID 的最大长度,但实际实现中通常有限制。 2. MQTT 中的 Keep Alive 时间单位是什么? A. 毫秒 B. 秒 C. 分钟 D. 小时 答案:…

作者头像 李华
网站建设 2026/4/14 13:15:43

Gemini 3 Pro国内使用教程(2025最新教程)

Gemini 3 Pro在编程、长文本处理、数学推理、科研文献解析以及图像识别等多个领域均展现出卓越性能&#xff0c;吸引了大量国内用户的关注。许多人都听闻过其强大功能&#xff0c;并渴望亲自体验&#xff0c;然而受网络条件、支付方式与账户注册等多重因素限制&#xff0c;能够…

作者头像 李华
网站建设 2026/3/28 14:43:14

leetcode 困难题 753. Cracking the Safe 破解保险箱

Problem: 753. Cracking the Safe 破解保险箱 解题过程 太难了&#xff0c;不会的&#xff0c;看了官方题解和另一个人的题解&#xff0c;总算稍稍理解了&#xff0c;dfs(0);&#xff0c;dfs从0开始&#xff0c;因n-1个0&#xff0c;实际数值还是0&#xff0c;所以的话就从0开始…

作者头像 李华
网站建设 2026/4/5 16:12:47

百度网盘解析工具终极指南:3分钟告别下载限速烦恼

百度网盘解析工具终极指南&#xff1a;3分钟告别下载限速烦恼 【免费下载链接】baidu-wangpan-parse 获取百度网盘分享文件的下载地址 项目地址: https://gitcode.com/gh_mirrors/ba/baidu-wangpan-parse 还在为百度网盘的龟速下载而抓狂吗&#xff1f;每次看着几十KB的…

作者头像 李华
网站建设 2026/4/1 18:27:55

LobeChat能否实现单元测试生成?覆盖率提升辅助工具

LobeChat能否实现单元测试生成&#xff1f;覆盖率提升辅助工具 在现代软件开发中&#xff0c;高质量的单元测试是保障系统稳定性的基石。然而&#xff0c;现实往往令人沮丧&#xff1a;许多团队仍在手动编写重复的测试用例&#xff0c;或是面对遗留代码束手无策——既不敢重构…

作者头像 李华