news 2026/4/23 17:45:16

通义实验室推出 Fun-ASR1.5:方言工业级可用,多语言识别能力大幅提升!

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
通义实验室推出 Fun-ASR1.5:方言工业级可用,多语言识别能力大幅提升!

通义实验室正式推出 Fun-ASR1.5 语音识别大模型,实现「方言工业级可用」,单模型覆盖 30 种语言及多种方言,典型方言场景字错误率大幅下降。

多语言与方言覆盖

Fun-ASR1.5 基于统一大模型架构,能无缝覆盖 30 种语言、汉语七大方言体系及 20 + 地方口音。目前已有 5 种方言准确率突破 90%,15 种超过 80%。

训练与场景适配

该模型基于超数十万小时真实方言语音数据训练,涵盖日常对话、地方新闻等多场景,支持汉语传统七大方言体系,适配 20 + 地区口音官话。

性能提升

测试显示,典型方言音频上,Fun-ASR1.5 相比上一版本平均字错误率相对下降 56.2%,赋能县域教育直播等长尾高价值应用场景。

特色能力

它支持 30 种主流语言精准识别,在混合语种对话等场景表现突出,还对中文古诗词识别专项优化,内部评测集字符级准确率达 97%。

后处理优化

Fun-ASR1.5 在后处理环节,标点预测更智能,文本归一化表现进一步提升。

编辑观点:Fun-ASR1.5 的推出,为语音识别领域带来新突破,有望在多领域广泛应用,推动方言文化传承和多语言交流发展。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/21 14:45:45

如何实现微信聊天记录的本地化永久保存与智能分析?

如何实现微信聊天记录的本地化永久保存与智能分析? 【免费下载链接】WeChatMsg 提取微信聊天记录,将其导出成HTML、Word、CSV文档永久保存,对聊天记录进行分析生成年度聊天报告 项目地址: https://gitcode.com/GitHub_Trending/we/WeChatMs…

作者头像 李华
网站建设 2026/4/21 14:43:20

如何快速提升设计效率:30个免费Illustrator自动化脚本完整指南

如何快速提升设计效率:30个免费Illustrator自动化脚本完整指南 【免费下载链接】illustrator-scripts Adobe Illustrator scripts 项目地址: https://gitcode.com/gh_mirrors/il/illustrator-scripts 还在为Adobe Illustrator中的重复性操作而烦恼吗&#xf…

作者头像 李华
网站建设 2026/4/21 14:38:30

如何快速掌握LLM Universe与LangChain:大模型开发的完整指南

如何快速掌握LLM Universe与LangChain:大模型开发的完整指南 【免费下载链接】llm-universe 本项目是一个面向小白开发者的大模型应用开发教程,在线阅读地址:https://datawhalechina.github.io/llm-universe/ 项目地址: https://gitcode.co…

作者头像 李华