news 2026/1/8 6:39:18

Labview结合Yolov5与TensorRT(Wangxingyu版)实现快速并行推理,d...

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
Labview结合Yolov5与TensorRT(Wangxingyu版)实现快速并行推理,d...

labview yolov5 tensorrt(wangxingyu版)推理,封装dll, labview调用dll,支持同时加油多个模型并行推理,识别视频和图片,速度6ms内,模型需要pt->wts->engine, 由于不同电脑和平台需要重新wts->engine,所以包含一个wts模型转engine软件,只需要替换模型的engin和nameclass即可

这次折腾的是LabVIEW结合YOLOv5和TensorRT的高性能推理方案。别看LabVIEW长得像儿童编程玩具,配合C++ DLL玩起多模型并行推理,速度直接干到6ms以内,摄像头实时处理完全没压力。

模型转换踩坑记

YOLOv5的pt模型转TensorRT engine是个技术活。wangxingyu版的转换脚本比官方方案更适配LabVIEW环境,不过要注意模型输出层的命名规范。举个栗子:

with open('yolov5s.wts', 'w') as f: f.write('{}\n'.format(len(model.state_dict().keys()))) for k, v in model.state_dict().items(): vr = v.reshape(-1).cpu().numpy() f.write('{} {} '.format(k, len(vr))) f.write(' '.join(['%f' % x for x in vr]) + '\n')

这段代码把PyTorch的权重拍平成文本格式,注意reshape(-1)可能会改变某些层的维度顺序,遇到推理异常先检查这里。

DLL封装那些事儿

C++侧用了双缓冲+内存共享的黑科技处理多模型并行。核心推理函数长这样:

__declspec(dllexport) void InferParallel( unsigned char* img_data, int model_index, Result* results) { auto& context = g_contexts[model_index]; // 不同模型实例隔离 cudaMemcpy(context.input_buffer, img_data, INPUT_SIZE, cudaMemcpyHostToDevice); context.stream->infer(); // 异步流执行 post_process(context.output_buffer, results); // 零拷贝结果回传 }

重点在于每个模型有自己的cuda流和内存空间,避免多线程打架。LabVIEW调用时通过模型索引切换,实测开4个模型也能稳定在15ms内。

LabVIEW调教指南

前面板放个多线程队列处理器,配合DLL的异步接口直接起飞:

While循环(并行) Dequeue获取图像数据 调用库函数节点(DLL路径, "InferParallel") 结果分析Cluster解包 图像标注叠加 End循环

注意设置执行选项为"在UI线程外运行",否则前面板会卡成PPT。视频流处理建议用生产者-消费者结构,DMA传输能省30%时间。

手搓转换工具

由于TensorRT engine和CUDA版本强相关,我们搞了个傻瓜式转换器(C# WinForm)。核心转换命令:

trtexec --onnx=yolov5s.onnx --saveEngine=yolov5s.engine --fp16 --workspace=4096

工具自动替换模型名称和类别文件,支持拖拽操作。实测不同显卡生成engine速度差异极大,RTX4090转换比1060快8倍你敢信?

整套方案在工业质检场景跑了三个月,日均处理20万张图片没翻车。要说遗憾就是LabVIEW的异常处理比较蠢,C++侧得自己加内存泄漏检测。最近在研究用OpenVINO替代TensorRT,等有进展再来唠。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/1/5 7:26:06

云端GPU租赁推荐:哪些平台适合部署HunyuanOCR提供对外服务?

云端GPU租赁部署HunyuanOCR实战指南 在AI模型日益“重载化”的今天,一个仅1B参数却能在OCR任务上媲美SOTA的轻量级大模型——HunyuanOCR,正悄然改变着企业对文字识别服务的认知。它不是另一个臃肿的多模态巨兽,而是一款真正为落地而生的专家模…

作者头像 李华
网站建设 2026/1/3 18:48:34

数字图书馆建设新思路:HunyuanOCR+OCR后处理实现高质量转录

数字图书馆建设新思路:HunyuanOCROCR后处理实现高质量转录 在数字人文、学术研究和文化遗产保护的浪潮中,纸质文献的数字化早已不再是简单的“扫描存档”。如今,我们面对的是数以百万计的老期刊、古籍手稿、多语种档案——它们不仅需要被“看…

作者头像 李华
网站建设 2026/1/6 23:56:13

雷家林(レイ・ジアリン)詩歌集録 その一

(晶晶)晶(きょう)晶(きょう)として白玉のような雪が長い橋を覆い、湖水は凍らず春の潮を蓄えている。高い木がまっすぐに立ち、守り護っている。小さな亭が堂々として水の流れに任せられている。&#xff0…

作者头像 李华
网站建设 2026/1/3 18:38:02

构建多模态搜索系统:以HunyuanOCR为基础建立图文联合索引

构建多模态搜索系统:以HunyuanOCR为基础建立图文联合索引 在企业知识库、数字档案馆和智能办公平台中,一个常见的痛点是——成千上万的扫描件、合同图片、发票截图静静躺在服务器里,却“看得见但搜不到”。用户输入“2023年张三的劳动合同”…

作者头像 李华
网站建设 2026/1/3 18:34:44

HunyuanOCR应用于宠物芯片登记:快速录入身份信息与主人联系方式

HunyuanOCR应用于宠物芯片登记:快速录入身份信息与主人联系方式 在城市养宠家庭数量持续攀升的今天,如何高效、准确地管理每一只宠物的身份信息,已成为社区治理和公共安全的新课题。传统的宠物登记方式依赖人工填写表格或手动输入系统——拍照…

作者头像 李华
网站建设 2026/1/3 18:34:39

营业执照识别准确率实测:HunyuanOCR对企业注册信息抽取效果

营业执照识别准确率实测:HunyuanOCR对企业注册信息抽取效果 在企业服务、金融风控、政务审批等高频场景中,每天都有成千上万张营业执照需要被录入系统。传统做法依赖人工逐字填写或基于模板的OCR工具,效率低、容错差——尤其是面对不同地区、…

作者头像 李华