news 2026/6/26 3:26:55

长音频离线流式识别 · 生成字幕

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
长音频离线流式识别 · 生成字幕
FireRedASR 大模型 manyspeech asr -t offline --model fireredasr2-aed-large-zh-en-int8-onnx-selfcrosskv-offline-20260212 -m chunk --format srt --threads 2 -i file -f "/path/to/0.wav" # FunASR 轻量模型 manyspeech asr -t offline --model Fun-ASR-Nano-2512-LLM-int8-onnx -m chunk --format srt --threads 2 -i file -f "/path/to/0.wav"

2. 麦克风离线流式识别 · 生成字幕

manyspeech asr -t offline --model fireredasr2-aed-large-zh-en-int8-onnx-selfcrosskv-offline-20260212 -m chunk --format srt --threads 2 -i mic manyspeech asr -t offline --model Fun-ASR-Nano-2512-LLM-int8-onnx -m chunk --format srt --threads 2 -i mic

3. 麦克风实时流式识别 · 实时生成字幕

manyspeech asr -t online --model paraformer-large-zh-en-int8-onnx-online -m chunk --format srt --threads 2 -i mic manyspeech asr -t online --model k2transducer-zipformer-ctc-large-zh-onnx-online-yuekai-20250630 -m chunk --format srt --threads 2 -i mic manyspeech asr -t online --model k2transducer-zipformer-ctc-xlarge-zh-onnx-online-yuekai-20250630 -m chunk --format srt --threads 2 -i mic

4. VAD 语音端点检测 · 剔除音频或录音的静音噪声等部分

# 麦克风在线检测 manyspeech vad -t online -i mic # 音频文件离线检测(剔除静音) manyspeech vad -t offline -f meeting.wav # 指定输出格式 manyspeech vad -t offline --format wav -f noisy_speech.wav

5. 标点符号恢复 · 为文本自动标点或重新标点(支持中英文)

# 直接输入文本 manyspeech punc --text "今天天气不错一起去郊游吧" # 从文件读取 manyspeech punc -f transcript.txt # 指定输出JSON格式 manyspeech punc --text "hello world" --format json # 交互输入 manyspeech punc
版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/26 3:26:19

【PolarCTF】赌王

打开页面发现就是老虎机,每次按都有3个图案应该是要3个图案都是一样的才有提示,这里直接用burp进行爆破,得到提示PHP 数组和数字比较的弱类型规则刚开始以为是目录,后面才知道是文件名,加上.php进行访问是一个比大小的…

作者头像 李华
网站建设 2026/6/26 3:25:44

上海女装定制品牌推荐

在上海这座融合历史与现代的时尚之都,寻找一家真正懂你、能为你量体裁衣的高端女装定制店铺,并不容易。今天想和你聊聊一家值得关注的品牌——William M Bespoke。虽然它最初以男士西装定制闻名,但凭借三十年的匠心工艺和对版型的深入研究&am…

作者头像 李华
网站建设 2026/6/26 3:23:42

终极指南:如何在Unreal Engine中实现运行时音频导入功能

终极指南:如何在Unreal Engine中实现运行时音频导入功能 【免费下载链接】RuntimeAudioImporter Runtime Audio Importer plugin for Unreal Engine. Importing audio of various formats at runtime. 项目地址: https://gitcode.com/gh_mirrors/ru/RuntimeAudioI…

作者头像 李华
网站建设 2026/6/26 3:21:44

RS485 通信信号线使用共模电感,这几个关键点一定要注意

RS485 通信信号线使用共模电感,这几个关键点一定要注意在 RS485 总线设计中,共模电感(Common-Mode Choke)是抑制共模干扰、提升 EMC 性能的常用器件。RS485 采用差分传输,共模电感对差模信号(有用信号&…

作者头像 李华
网站建设 2026/6/26 3:21:31

Kubernetes 存储与配置管理核心精要

一、Volume 存储卷类型类型特点生命周期典型场景emptyDir临时空目录,Pod 内多容器共享Pod 删除即清除缓存、临时数据交换hostPath挂载宿主机目录Pod 删除数据保留(节点级)单节点测试、访问宿主机文件NFS挂载网络共享存储Pod 删除数据保留多 P…

作者头像 李华
网站建设 2026/6/26 3:21:04

G-Helper终极指南:如何让华硕笔记本性能翻倍,续航提升30%

G-Helper终极指南:如何让华硕笔记本性能翻倍,续航提升30% 【免费下载链接】g-helper Lightweight Armoury Crate alternative for Asus laptops with nearly the same functionality. Works with ROG Zephyrus, Flow, TUF, Strix, Scar, ProArt, Vivoboo…

作者头像 李华