news 2026/5/23 20:00:23

FFmpeg 视频解码进阶:H264_CUVID 硬解码器简单示例

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
FFmpeg 视频解码进阶:H264_CUVID 硬解码器简单示例

🎬 FFmpeg 视频解码入门:H264_CUVID 硬解码器简单示例
📅 更新时间:2026 年1月2日
🏷️ 标签:FFmpeg | H264_CUVID | NVIDIA | 硬件解码 | CUDA | GPU

文章目录

  • 📖 前言
  • 🔄 与软解码的主要区别
  • 💻 完整代码
  • 🎯 硬解码关键点详解
    • 1️⃣ 新增头文件
    • 2️⃣ 新增变量
    • 3️⃣ 创建 CUDA 硬件设备上下文
    • 4️⃣ 使用 `avcodec_find_decoder_by_name` 查找解码器
    • 5️⃣ 绑定硬件设备上下文
    • 6️⃣ GPU → CPU 数据传输(核心!)
    • 7️⃣ NV12 格式处理
    • 8️⃣ 资源释放
  • 📊 软解码 vs 硬解码代码对比
  • 🎥 验证解码结果
  • 📋 总结
    • 硬解码相比软解码的额外步骤
    • 使用硬解码的前提条件

📖 前言

在上一篇文章中,我们介绍了如何使用 FFmpeg 调用 H264 软解码器进行视频解码。本文将介绍如何使用h264_cuvid硬件解码器,利用 NVIDIA GPU 进行硬件加速解码(仅解码视频流!!!)

软解码 vs 硬解码

特性h264 (软解码)h264_cuvid (硬解码)
执行设备CPUNVIDIA GPU
CPU 占用
适用场景通用多路解码、高分辨率
依赖NVIDIA GPU + CUDA

🔄 与软解码的主要区别

硬解码的流程与软解码基本相同,但有以下4 个关键区别

┌─────────────────────────────────────────────────────────────┐ │ 软解码 vs 硬解码 │ ├─────────────────────────────────────────────────────────────┤ │ │ │ 1️⃣ 解码器查找方式不同 │ │ 软解: avcodec_find_decoder(codec_id) │ │ 硬解: avcodec_find_decoder_by_name("h264_cuvid") │ │ │ │ 2️⃣ 需要创建硬件设备上下文 │ │ av_hwdevice_ctx_create(&hw_device_ctx, CUDA, ...) │ │ │ │ 3️⃣ 解码后数据在 GPU 显存,需要传输到 CPU │ │ av_hwframe_transfer_data(sw_frame, frame, 0) │ │ │ │ 4️⃣ 输出像素格式不同 │ │ 软解: YUV420P (平面存储) │ │ 硬解: NV12 (UV交错存储) │ │ │ └─────────────────────────────────────────────────────────────┘

💻 完整代码

#include<iostream>extern"C"{#include<libavcodec/avcodec.h>#include<libavformat/avformat.h>#include<libavutil/avutil.h>#include<libavutil/hwcontext.h>}//打印错误原因voidlog_error(interror,std::string tmp){charerrbuf[256];av_strerror(error,errbuf,sizeof(errbuf));std::cout<<tmp<<","<<errbuf<<std::endl;}//将NV12格式的帧写入YUV420P文件voidwrite_nv12_to_yuv420p(AVFrame*frame,FILE*file_yuv){//写入Y分量for(inti=0;i<frame->height;i++){fwrite(frame->data[0]+i*frame->linesize[0],1,frame->width,file_yuv);}//NV12的UV是交错存储的,需要分离成U和Vintuv_height=frame->height/2;intuv_width=frame->width/2;//分配临时缓冲区存储U和Vuint8_t*u_plane=newuint8_t[uv_height*uv_width];uint8_t*v_plane=newuint8_t[uv_height*uv_width];//从NV12的UV交错数据中分离U和Vfor(inti=0;i<uv_height;i++){uint8_t*uv_row=frame->data[1]+i*frame->linesize[1];for(intj=0;j<uv_width;j++){u_plane[i*uv_width+j]=uv_row[j*2];// Uv_plane[i*uv_width+j]=uv_row[j*2+1];// V}}//写入U分量fwrite(u_plane,1,uv_height*uv_width,file_yuv);//写入V分量fwrite(v_plane,1,uv_height*uv_width,file_yuv);delete[]u_plane;delete[]v_plane;}intmain(){// 配置AVFormatContext*avformat_context=nullptr;AVCodecContext*avcodec_context=nullptr;AVStream*video_stream=nullptr;AVPacket*packet=nullptr;AVFrame*frame=nullptr;AVFrame*sw_frame=nullptr;//用于存储从GPU传输到CPU的帧constAVCodec*decode=nullptr;AVBufferRef*hw_device_ctx=nullptr;// 硬件设备上下文constchar*file_url="D:/桌面/视频录制/500001652967108-1-192.mp4";intresult=0;intvideo_index=0;FILE*file_yuv=fopen("output_h264_cuvid.yuv","wb");if(!file_yuv){std::cout<<"无法创建输出文件"<<std::endl;return-1;}std::cout<<"成功创建输出文件"<<std::endl;//创建CUDA硬件设备上下文result=av_hwdevice_ctx_create(&hw_device_ctx,AV_HWDEVICE_TYPE_CUDA,nullptr,nullptr,0);if(result<0){log_error(result,"无法创建CUDA硬件设备上下文");fclose(file_yuv);return-1;}std::cout<<"成功创建CUDA硬件设备上下文"<<std::endl;//打开视频result=avformat_open_input(&avformat_context,file_url,nullptr,nullptr);if(result<0){log_error(result,"视频文件打开失败");av_buffer_unref(&hw_device_ctx);fclose(file_yuv);return-1;}std::cout<<"成功打开mp4视频文件"<<std::endl;//寻找视频流result=av_find_best_stream(avformat_context,AVMEDIA_TYPE_VIDEO,-1,-1,nullptr,0);if(result<0){log_error(result,"未找到视频流索引");avformat_close_input(&avformat_context);av_buffer_unref(&hw_device_ctx);fclose(file_yuv);return-1;}video_index=result;std::cout<<"视频流索引:"<<video_index<<std::endl;video_stream=avformat_context->streams[video_index];//使用h264_cuvid硬件解码器decode=avcodec_find_decoder_by_name("h264_cuvid");if(!decode){std::cout<<"未找到h264_cuvid解码器"<<std::endl;avformat_close_input(&avformat_context);av_buffer_unref(&hw_device_ctx);fclose(file_yuv);return-1;}std::cout<<"解码器:"<<decode->name<<std::endl;//分配解码器上下文avcodec_context=avcodec_alloc_context3(decode);avcodec_parameters_to_context(avcodec_context,video_stream->codecpar);avcodec_context->pkt_timebase=video_stream->time_base;avcodec_context->hw_device_ctx=av_buffer_ref(hw_device_ctx);//打开解码器result=avcodec_open2(avcodec_context,decode,nullptr);if(result<0){log_error(result,"解码器信息配置失败");avcodec_free_context(&avcodec_context);avformat_close_input(&avformat_context);av_buffer_unref(&hw_device_ctx);fclose(file_yuv);return-1;}std::cout<<"解码器信息配置成功"<<std::endl;//分配packet和framepacket=av_packet_alloc();frame=av_frame_alloc();sw_frame=av_frame_alloc();intframe_count=0;//解码循环while(av_read_frame(avformat_context,packet)>=0){if(packet->stream_index==video_index){result=avcodec_send_packet(avcodec_context,packet);if(result<0){log_error(result,"发送packet给解码器失败");av_packet_unref(packet);continue;}while(avcodec_receive_frame(avcodec_context,frame)==0){//GPU -> CPU 数据传输,输出格式为NV12result=av_hwframe_transfer_data(sw_frame,frame,0);if(result<0){log_error(result,"GPU到CPU数据传输失败");av_frame_unref(frame);break;}//写入YUV文件(NV12转YUV420P)write_nv12_to_yuv420p(sw_frame,file_yuv);frame_count++;if(frame_count%100==0){std::cout<<"已解码 "<<frame_count<<" 帧"<<std::endl;}av_frame_unref(sw_frame);av_frame_unref(frame);}}av_packet_unref(packet);}//刷新解码器缓冲区avcodec_send_packet(avcodec_context,nullptr);while(avcodec_receive_frame(avcodec_context,frame)==0){result=av_hwframe_transfer_data(sw_frame,frame,0);if(result<0){av_frame_unref(frame);break;}write_nv12_to_yuv420p(sw_frame,file_yuv);frame_count++;av_frame_unref(sw_frame);av_frame_unref(frame);}std::cout<<"解码完成,共解码 "<<frame_count<<" 帧"<<std::endl;//资源回收fclose(file_yuv);av_packet_free(&packet);av_frame_free(&frame);av_frame_free(&sw_frame);avcodec_free_context(&avcodec_context);avformat_close_input(&avformat_context);av_buffer_unref(&hw_device_ctx);return0;}

🎯 硬解码关键点详解

1️⃣ 新增头文件

#include<libavutil/hwcontext.h>// 硬件上下文相关API

2️⃣ 新增变量

AVFrame*sw_frame=nullptr;// 用于存储从GPU传输到CPU的帧AVBufferRef*hw_device_ctx=nullptr;// 硬件设备上下文
变量作用
sw_frame存储从 GPU 传输到 CPU 的帧数据
hw_device_ctxCUDA 硬件设备上下文,管理 GPU 资源

3️⃣ 创建 CUDA 硬件设备上下文

result=av_hwdevice_ctx_create(&hw_device_ctx,AV_HWDEVICE_TYPE_CUDA,nullptr,nullptr,0);

函数原型

intav_hwdevice_ctx_create(AVBufferRef**device_ctx,enumAVHWDeviceTypetype,constchar*device,AVDictionary*opts,intflags);
参数说明
device_ctx输出参数,创建的硬件设备上下文
type硬件类型,这里是AV_HWDEVICE_TYPE_CUDA
device设备名称,nullptr 表示使用默认 GPU
opts额外选项,通常为 nullptr
flags标志位,通常为 0

4️⃣ 使用avcodec_find_decoder_by_name查找解码器

// 软解码:根据 codec_id 自动查找decode=avcodec_find_decoder(video_stream->codecpar->codec_id);// 硬解码:必须指定解码器名称decode=avcodec_find_decoder_by_name("h264_cuvid");

为什么不能用avcodec_find_decoder

因为avcodec_find_decoder(AV_CODEC_ID_H264)会返回默认的软解码器h264,而不是硬解码器h264_cuvid


5️⃣ 绑定硬件设备上下文

avcodec_context->pkt_timebase=video_stream->time_base;// 设置时间基准avcodec_context->hw_device_ctx=av_buffer_ref(hw_device_ctx);// 绑定硬件上下文

注意

  • pkt_timebase必须设置,否则会出现Invalid pkt_timebase警告
  • hw_device_ctx必须在avcodec_open2之前绑定

6️⃣ GPU → CPU 数据传输(核心!)

// frame 在 GPU 显存中result=av_hwframe_transfer_data(sw_frame,frame,0);// sw_frame 在 CPU 内存中,可以进行后续处理

数据流向

GPU显存 CPU内存 ┌─────────┐ ┌─────────┐ │ frame │ ──传输(拷贝)──→ │sw_frame │ │ (解码后) │ av_hwframe_ │ (副本) │ │ CUDA │ transfer_data() │ NV12 │ └─────────┘ └─────────┘

为什么需要传输?

硬解码后的数据存储在 GPU 显存中,CPU 无法直接访问。如果要写入文件或进行 CPU 处理,必须先传输到 CPU 内存。


7️⃣ NV12 格式处理

硬解码输出的像素格式是NV12,与软解码的YUV420P不同:

YUV420P (软解码输出): NV12 (硬解码输出): ┌──────────┐ ┌──────────┐ │ Y │ data[0] │ Y │ data[0] ├──────────┤ ├──────────┤ │ U │ data[1] │ UVUV │ data[1] (UV交错) ├──────────┤ └──────────┘ │ V │ data[2] └──────────┘

NV12 转 YUV420P 的关键代码

// 从 NV12 的 UV 交错数据中分离 U 和 Vfor(inti=0;i<uv_height;i++){uint8_t*uv_row=frame->data[1]+i*frame->linesize[1];for(intj=0;j<uv_width;j++){u_plane[i*uv_width+j]=uv_row[j*2];// U 在偶数位置v_plane[i*uv_width+j]=uv_row[j*2+1];// V 在奇数位置}}

8️⃣ 资源释放

// 新增:释放硬件设备上下文av_buffer_unref(&hw_device_ctx);// 新增:释放 sw_frameav_frame_free(&sw_frame);

📊 软解码 vs 硬解码代码对比

步骤软解码硬解码
头文件无额外+ hwcontext.h
变量frame+ sw_frame, hw_device_ctx
硬件初始化av_hwdevice_ctx_create()
查找解码器avcodec_find_decoder()avcodec_find_decoder_by_name()
绑定上下文avcodec_context->hw_device_ctx = ...
数据传输av_hwframe_transfer_data()
像素格式YUV420PNV12
资源释放无额外+ av_buffer_unref()

🎥 验证解码结果

解码完成后,会生成output_h264_cuvid.yuv文件。使用 ffplay 播放:

ffplay-frawvideo-video_size1280x720-pixel_formatyuv420p output_h264_cuvid.yuv

📋 总结

硬解码相比软解码的额外步骤

1. av_hwdevice_ctx_create() ← 创建 CUDA 设备上下文 2. avcodec_find_decoder_by_name("h264_cuvid") ← 指定硬解码器 3. avcodec_context->hw_device_ctx = ... ← 绑定硬件上下文 4. av_hwframe_transfer_data() ← GPU → CPU 数据传输 5. NV12 → YUV420P 格式转换 ← 处理不同的像素格式 6. av_buffer_unref() ← 释放硬件上下文

使用硬解码的前提条件

  • ✅ NVIDIA GPU(支持 NVDEC)
  • ✅ 正确安装的 NVIDIA 驱动
  • ✅ FFmpeg 编译时启用了--enable-cuda --enable-cuvid

如果您觉得这篇文章对您有帮助,不妨点赞 + 收藏 + 关注,更多 FFmpeg 系列教程将持续更新 🔥!

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/12 17:04:59

java计算机毕业设计学生信息管理系统 高校学生综合信息服务平台 校园学籍教务一体化管理系统

计算机毕业设计学生信息管理系统064p99 &#xff08;配套有源码 程序 mysql数据库 论文&#xff09; 本套源码可以在文本联xi,先看具体系统功能演示视频领取&#xff0c;可分享源码参考。当“一人一张表”的 Excel 时代过去&#xff0c;学生从入学到毕业产生的每一条数据——学…

作者头像 李华
网站建设 2026/5/15 20:45:33

2025-我的CSDN年度创作历程与成长盘点

目录 一、创作起点&#xff1a;从“记录”到“分享”&#xff0c;锚定输出初心 二、年度突破&#xff1a;专栏订阅与被动收入&#xff0c;点燃创作新热情 三、收获与沉淀&#xff1a;不止于创作&#xff0c;更在于成长 四、未来展望&#xff1a;以热爱为舟&#xff0c;向更深…

作者头像 李华
网站建设 2026/5/22 7:45:22

一直很忙,就是不赚钱

团队看起来在往前走,其实是在原地踏步。每年都在做项目,看着挺忙碌,挺充实。但仔细一看,用的还是五年前的那套流程,EDA工具版本停留在上古时代,验证方法学还停留在"能跑通就行"的阶段。最可怕的不是停滞,而是用低效的忙碌制造前进的假象。效率低下会上瘾当一个芯片团…

作者头像 李华
网站建设 2026/5/21 5:54:35

可解释聚类的介绍

原文&#xff1a;towardsdatascience.com/introduction-to-interpretable-clustering-d0e07fbd2c99 聚类是一种流行的无监督学习任务&#xff0c;它将相似的数据点分组。尽管这是一个常见的机器学习任务&#xff0c;但大多数聚类算法都不解释每个聚类的特征或为什么一个点与一个…

作者头像 李华
网站建设 2026/5/19 8:24:06

JavaScript脚本自动化批量提交Sonic视频生成任务

JavaScript脚本自动化批量提交Sonic视频生成任务 在短视频内容爆炸式增长的今天&#xff0c;企业对“数字人”视频的需求早已从“有没有”转向“快不快、多不多、稳不稳”。一个典型的场景是&#xff1a;某教育平台需要为100位讲师每人生成一段5分钟的课程讲解视频。如果依赖人…

作者头像 李华
网站建设 2026/5/11 23:24:43

多用户共享Sonic服务如何管理权限?需自行开发控制层

多用户共享Sonic服务如何管理权限&#xff1f;需自行开发控制层 在数字人技术加速落地的今天&#xff0c;越来越多企业希望利用AI生成“会说话的虚拟形象”来降本增效——无论是电商带货、在线教育&#xff0c;还是智能客服场景&#xff0c;只需一张照片和一段音频就能驱动人物…

作者头像 李华