GitHub Issue创建时支持上传Fun-ASR转录附件-开发者社区

GitHub Issue创建时支持上传Fun-ASR转录附件

在智能语音产品日益普及的今天，研发团队每天都会收到来自用户、客服或测试人员的大量语音反馈——比如“我明明说的是‘明天几点关门’，怎么识别成了‘明天吃鸡关门’？”这类问题如果仅靠口头描述，往往难以复现和定位。更糟糕的是，这些宝贵的语音数据常常散落在微信群、邮件附件甚至录音笔里，最终石沉大海。

有没有一种方式，能让语音问题像代码缺陷一样被精准记录、版本化管理，并直接进入开发流程？答案是肯定的。借助Fun-ASR的本地化语音识别能力与GitHub Issue 系统的协作机制，我们完全可以构建一条从“听到声音”到“写进任务”的自动化通路。

Fun-ASR：不只是语音转文字

Fun-ASR 并非简单的开源模型封装，而是钉钉联合通义实验室推出的高性能 ASR 系统，专为中文复杂语境优化，尤其适合企业级部署场景。它最大的优势在于“可控”二字：不依赖云端 API、数据不出内网、支持热词定制，真正做到了安全与效果兼顾。

它的处理流程远比“语音输入→文本输出”要精细得多：

音频预处理阶段会自动统一采样率（通常为 16kHz），并对常见背景噪声进行抑制；
特征提取使用深度神经网络提取 MFCC 或更高级的声学表示；
端到端推理基于 Conformer 架构，在长句理解和口语断句上表现优异；
最关键的是ITN 文本规整模块——它可以将“我三十一岁了”自动转换为“我31岁了”，把“二零二五年一月一号”变成“2025年1月1日”。这种“听懂人话”的能力，极大提升了后续分析的可用性。

此外，Fun-ASR 提供图形化 WebUI，普通测试员也能轻松操作。识别结果默认保存在webui/data/history.db的 SQLite 数据库中，支持导出为.txt、.json等多种格式，这为后续自动化集成打下了坚实基础。

相比传统云服务 ASR 工具，其核心差异体现在以下几个方面：

维度	传统云 ASR	Fun-ASR
部署模式	必须联网调用	支持完全离线运行
数据隐私	存在网络传输风险	全程本地处理，无外泄可能
定制能力	热词支持有限	可上传专属词汇表增强识别
成本结构	按调用量计费	一次性部署，长期零边际成本
批量处理	接口并发受限	内置批量模块，支持多文件并行
使用门槛	需编程调用 API	提供可视化界面，非技术人员也可用

这意味着，哪怕是一个没有编程背景的产品经理，也能用它快速完成一段会议录音的文字转化，并将结果交给工程师进一步分析。

如何让语音问题“走进”GitHub？

GitHub 原生并不支持上传语音文件或将转录内容作为附件嵌入 Issue，但这并不意味着无法实现。我们可以通过一个轻量级的自动化脚本，打通 Fun-ASR 输出与 GitHub 的最后一公里。

整个流程的本质是一个CI/CD 风格的工作流：

[音频文件] → [Fun-ASR 识别] → [生成 JSON 转录文件] → [Python 脚本读取 + 格式化] → [调用 GitHub API 创建 Issue]

具体来说，当测试人员完成一次语音识别后，系统会导出一份包含原始文本、规整后文本、时间戳、语言类型等元信息的 JSON 文件。接着，通过一个简单的命令行脚本，就能把这个文件的内容以 Markdown 形式提交到指定仓库的新 Issue 中。

这个过程的关键参数包括：

GitHub Personal Access Token (PAT)：用于身份认证，建议只授予repo:issue权限，遵循最小权限原则；
目标仓库名：格式为username/repo-name；
Issue 标题生成策略：可基于音频文件名自动提取关键词，例如call_20250405_customer_service.mp3自动生成标题“【语音反馈】客户咨询营业时间识别异常”；
附件格式选择：
.txt适合纯文本展示；
.json更利于程序解析，便于后期做自动化质量评估；
频率控制：GitHub 免费账户每小时最多 5000 次 API 请求，因此脚本应具备重试与退避机制。

下面是一个实际可用的 Python 实现示例：

import requests import json from datetime import datetime # 配置参数 GITHUB_TOKEN = "your_personal_access_token" REPO = "username/project-repo" # 替换为目标仓库 HEADERS = { "Authorization": f"token {GITHUB_TOKEN}", "Accept": "application/vnd.github.v3+json" } def create_github_issue(title, body, labels=None): """ 创建 GitHub Issue :param title: Issue 标题 :param body: 正文内容（支持 Markdown） :param labels: 标签列表，如 ["bug", "speech"] """ url = f"https://api.github.com/repos/{REPO}/issues" payload = { "title": title, "body": body, "labels": labels or [] } response = requests.post(url, headers=HEADERS, data=json.dumps(payload)) if response.status_code == 201: print("✅ Issue 创建成功！") return response.json()["html_url"] else: print(f"❌ 创建失败：{response.status_code}, {response.text}") return None def read_asr_transcript(file_path): """ 读取 Fun-ASR 导出的转录文件 假设文件为 JSON 格式，包含原始与规整文本 """ with open(file_path, 'r', encoding='utf-8') as f: data = json.load(f) return f""" ## 📄 语音识别结果 - **音频文件**: `{data.get('filename', 'unknown')}` - **识别时间**: `{data.get('timestamp', 'N/A')}` - **语言**: `{data.get('language', 'zh')}` - **启用 ITN**: `{data.get('itn_enabled', False)}` ### 原始文本 {data.get('raw_text', '')} ### 规整后文本 {data.get('normalized_text', '')} """ # 示例调用 if __name__ == "__main__": transcript = read_asr_transcript("output/transcript_20251220.json") issue_title = "【语音反馈】客户咨询营业时间识别异常" url = create_github_issue( title=issue_title, body=transcript, labels=["speech", "enhancement"] ) if url: print(f"🔗 Issue 地址: {url}")

这段代码虽然简洁，但已经实现了核心功能：从本地读取转录结果，格式化为结构化 Markdown 内容，并通过 GitHub REST API 自动创建 Issue。更重要的是，它完全可扩展——你可以加入目录监听（如watchdog库），实现“只要新生成一个 JSON 文件，就自动提交 Issue”的全自动流程。