news 2026/3/9 14:42:08

通义系列大模型

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
通义系列大模型

通义是阿里云自主研发的通用人工智能大模型,前身为2023年4月启动邀请测试的“通义千问”,同年9月备案后向公众开放。名称源自《汉书》“天地之常经,古今之通义也”,意为“普遍适用的道理”。基于Transformer架构,具备多模态理解、逻辑推理、多语言交互及长文本处理能力(2024年3月免费开放1000万字长文档处理功能)。支持文案创作、代码生成、语音转写等功能,覆盖编程、金融、医疗、法律等八大行业,提供通义灵码、通义智文、通义听悟、通义星尘、通义点金、通义晓蜜、通义仁心、通义法睿等模型。2024年5月发布2.5版本并更名为通义,2025年4月推出Qwen3系列。2023年12月通过国家大模型标准评测,2025年11月获世界互联网大会“领先科技奖”,同年新加坡国家AI计划采用其作为技术底座。截至2025年,通义APP用户突破5000万,2025年12月阿里云在MaaS市场获评全球领导者。

发展历程

2023年

2023年4月7日,通义千问开始邀请测试。

2023年4月11日,阿里巴巴所有产品未来将接入通义千问大模型,进行全面改造,包括天猫、钉钉、高德地图、淘宝、优酷、盒马等;同4月,钉钉首次发布基于阿里千问大模型的智能化能力,用户输入斜杠“/”即可唤起10余项AI能力。通义千问 AI 大模型接入天猫精灵,开启相关内测招募。阿里云工程师在实验将千问大模型接入工业机器人,在钉钉对话框输入一句汉字,可远程指挥机器人工作。

2023年9月,通义千问正式向公众开放;淘宝内测应用淘宝问问接入通义千问,基于通义千问的文本理解与文本生成能力实现全新的交互体验以及推荐;同月25日,阿里云宣布开源通义千问140亿参数模型Qwen-14B及其对话模型Qwen-14B-Chat,免费可商用;

同年10月31日,2023云栖大会现场,阿里大模型家族全面升级发布,通义千问2.0正式升级发布。通义千问App也随之发布。

2023年11月7日,阿里云旗下通义千问 App 上架苹果App Store,安装包大小为 25.9 MB,此前这款 App 已在各大安卓应用市场上架;同月16日,阿里巴巴公告,截至9月30日,钉钉17条产品线已经全面接入大模型。钉钉还面向客户及生态体系合作伙伴开放其智能化底座AIPaaS,以助生态体系参与者重塑其产品。

2023年12月1日,阿里云开源通义千问720亿参数模型Qwen-72B、18亿参数模型Qwen-1.8B及音频大模型Qwen-Audio;同月2月22日,国内首个官方“大模型标准符合性评测”结果公布,阿里云通义千问成为首批通过评测的四款国产大模型之一,在通用性、智能性等维度均达到国家相关标准要求。

2024年

2024年1月4日,阿里云旗下的通义千问 App 上线了一项免费的新功能“通义舞王”:用户在按照提示要求上传照片后,经过十几分钟的等待,即可自动生成舞蹈视频;同月22日,由中国一汽联合阿里云通义千问打造的大模型应用GPT-BI落地;同月26日,阿里云公布多模态大模型研究进展。通义千问视觉理解模型Qwen-VL再次升级,继Plus版本之后,再次推出Max版本。

2024年3月22日,阿里云旗下的通义千问宣布升级,向所有人免费开放1000万字的长文档处理功能;同月29日,通义千问团队开源首个MoE模型,名为Qwen1.5-MoE-A2.7B,有27亿个激活参数。

2024年4月3日,刚刚成为阿里云一号AI员工的通义灵码正式上线通义千问APP,并向全民免费开放;同月7日,阿里云通义千问开源320亿参数模型Qwen1.5-32B,可最大限度兼顾性能、效率和内存占用的平衡。通义千问此前已开源5亿、18亿、40亿、70亿、140亿和720亿参数的6款大语言模型并均已升级至1.5版本;同月28日,据“阿里通义千问”消息,通义千问首次推出千亿级参数模型Qwen1.5-110B。Qwen1.5-110B是Qwen1.5系列中规模最大的模型,也是该系列中首个拥有超1000亿参数的模型。

2024年5月,通义千问2.5大模型版本发布并更名为通义。5月21日消息,阿里云宣布通义千问GPT-4级主力模型Qwen-Long,API输入价格从0.02元/千tokens降至0.0005元/千tokens,直降97%。

2024年6月7日,阿里通义千问Qwen2大模型发布,并在Hugging Face和ModelScope上同步开源。

2024年6月21日,携程已接入阿里云通义千问大模型,支持其全球业务发展。此外,哈啰集团已与阿里云达成深度合作,全方位接入阿里云通义大模型。

2024年7月,在2024世界人工智能大会上,阿里云CTO周靖人透露,近2个月,通义千问开源模型下载量增长2倍,突破2000万次,阿里云百炼服务客户数从9万增长至23万,涨幅超150%。

2024年7月26日,巴黎奥运会期间,通义App上线赛事百事通、全民云运动、AI运动写真等多款新功能。这些新功能基于通义大模型打造,让国内体育迷们看奥运、聊奥运的同时,也能体验AI技术带来的观赛新体验。7月31日,阿里通义宣布免费开放奥运AI大模型,具备最强奥运专业知识,并集合同声传译级别的中法互译功能。7月31日起,用户可以在通义APP免费使用。

2024年8月,阿里通义千问开源 Qwen2-Audio 系列的两个模型 Qwen2-Audio-7B 和 Qwen2-Audio-7B-Instruct。8月19日,通义千问宣布启用新域名:tongyi.ai。8月30日消息,通义网页版上线“PPT创作”功能,具备言之有物、设计精美、智能编排三大核心特点。8月30日,阿里通义千问发布第二代视觉语言模型Qwen2-VL,旗舰模型Qwen2-VL-72B的API已上线阿里云百炼平台。9月2日消息,阿里云通义千问宣布开源第二代视觉语言模型 Qwen2-VL,并推出 2B、7B 两个尺寸及其量化版本模型。同时,旗舰模型 Qwen2-VL-72B 的 API 已上线阿里云百炼平台,用户可直接调用。9月19日消息,2024云栖大会上,阿里云CTO周靖人发布通义千问新一代开源模型Qwen2.5。9月19日,阿里巴巴宣布,阿里云百炼平台上的三款通义千问主力模型再次降价。其中,Qwen-Turbo的价格低至每百万输入tokens0.3元,较之前直降85%,Qwen-Plus和Qwen-Max的输入价格则分别降价80%和50%。11月15日,从阿里云方面获悉,旗下大模型通义上线代码模式,一句“大白话”就能生成应用,包括小游戏、数据图表、网站、简历等。11月27日,通义官宣通义App鸿蒙原生版正式上架HarmonyOS NEXT应用市场。12月25日,阿里云通义千问发布首个开源多模态推理模型QVQ-72B-Preview。12月31日,阿里云官宣!本年度第三轮大模型降价,通义千问视觉理解模型全线降价超80%。其中Qwen-VL-Plus直降81%,输入价格仅为0.0015元/千tokens,创下全网最低价格;更高性能的Qwen-VL-Max降至0.003元/千tokens,降幅高达85%。

2025年

2025年1月27日,阿里云通义千问Qwen团队正式推出开源的Qwen2.5-1M模型及其对应的推理框架支持。本次发布了两个新的开源模型,分别是Qwen2.5-7B-Instruct-1M和Qwen2.5-14B-Instruct-1M,这是Qwen首次将开源的Qwen模型的上下文扩展到1M长度。1月29日,阿里云通义千问旗舰版模型Qwen2.5-Max正式发布。该模型预训练数据超过20万亿tokens。截至2月19日,阿里通义千问开源模型下载量为2亿,基于阿里通义模型衍生模型数量超过9万个,此外阿里的魔搭社区有超过4万家模型入驻,有超过1000万用户数。

2025年2月28日,荣耀表示,已与阿里在 AI 领域展开合作,为全球用户提供服务。目前千问(Qwen)、万相(Wan)等多款语言、视觉理解、图像生成模型已接入荣耀 YOYO 智能体,用户可通过 Magic7 系列手机等终端体验 AI 功能。

2025年3月6日,阿里巴巴发布并开源全新的推理模型通义千问QwQ-32B。3月11日,Manus平台宣布与阿里通义千问团队正式达成战略合作,双方将基于通义千问系列开源模型,在国产模型和算力平台上实现Manus的全部功能。

2025年3月11日,基于全模态场景,通义实验室团队探索了RLVR 与视频全模态模型的结合,宣布开源 R1-Omni 模型。R1-Omni 的一大亮点在于其透明性(推理能力)。通过 RLVR 方法,音频信息和视频信息在模型中的作用变得更加清晰可见。

3月14日消息,英国、新加坡、日本等多国创企接入阿里通义千问。3月,LiblibAI接入阿里通义系列大模型。

3月26日,宝马集团宣布与阿里巴巴集团在中国达成AI领域战略合作,双方在AI大语言模型和智能语音交互等领域开展联合研发,阿里通义大模型将应用于中国市场的宝马新世代系列车型。

3月27日,通义千问宣布发布Qwen2.5-Omni。

4月29日,阿里巴巴通义千问发布新版Qwen3系列模型,包括2个MoE模型和6个dense模型,参数量从0.6B到235B。称其在数学和编程等多个方面均可与DeepSeek的性能相媲美。与其他主流模型相比,Qwen3还显著降低了部署成本。

4月29日,通义App与通义网页版全面上线阿里新一代通义千问开源模型Qwen3(简称千问3),用户可以第一时间在通义App和网页版中的专属智能体“千问大模型”,以及主对话页面,体验到全球最强开源模型的智能能力。

6月6日上午消息,阿里开源通义千问3全新的向量模型系列 Qwen3-Embedding(简称千问3向量模型)

6月9日,阿里云发文宣布:比亚迪接入通义大模型。

6月27日,阿里通义千问宣布推出多模态模型 Qwen VLo,实现从感知到生成的跨越。

7月7日,阿里云宣布,通义正式开源网络智能体WebSailor

7月11日晚间,阿里通义千问宣布Qwen Chat更新,网页首页可直接开聊,还能支持“深入研究、图像生成、网页开发、深度思考、搜索”等多种功能。此外,Qwen Chat新增桌面端,支持一键唤起MCP,直接调用。

7月22日,阿里通义千问宣布推出旗舰版Qwen3模型的更新版本Qwen3-235B-A22B-Instruct-2507-FP8,该版本为非思考模式(Non-thinking),并将长文本处理能力提升至256K。新模型已在魔搭社区和HuggingFace开源平台上线更新。此次升级显著增强模型性能,长文本支持扩展到256K,提升处理复杂任务的能力。

7月23日,阿里云通义团队发布公告,宣布通义千问最新的AI编程大模型Qwen3-Coder正式开源,号称是“面向世界的智能编程引擎”,这也是该团队迄今为止最具Agent能力的代码模型。同期,通义千问还发布并开源了一款专为代理式编程设计的命令行工具Qwen Code。

7月24日,阿里云通义千问宣布Qwen-MT 机器翻译模型:支持 92 种语言互译,每百万输出 token 低至2元。

7月28日,阿里开源视频生成模型“通义万相 Wan2.2”,此次共开源文生视频(Wan2.2-T2V-A14B)、图生视频(Wan2.2-I2V-A14B)和统一视频生成(Wan2.2-IT2V-5B)三款模型。

7月30日,阿里通义千问宣布Qwen3-30B-A3B模型推出新版本Qwen3-30B-A3B-Instruct-2507,这是一个非思考模式(non-thinking mode)的新模型,长文本理解能力提升至256K,仅激活3B参数,就能取得可媲美Gemini 2.5-Flash(non-thinking)、GPT-4o等闭源模型的性能。

8月1日,据通义千问消息,阿里通义千问推出编程模型Qwen3-Coder-Flash。

8月5日消息,通义千问发布了首个开源图像生成基础模型Qwen-Image,Qwen-Image是一个200亿参数的MMDiT模型,是通义千问系列中首个图像生成基础模型。

8月9日,阿里云通义千问官方宣布,AI 编程智能体 Qwen Code 用户每天可免费获得 2000 次(请求)运行权限,且没有 Token 限制。

8月15日,通义千问宣布,Qwen3 100万tokens上下文再拓展、Qwen Chat Deep Reseache再升级、ComfyUI上线Qwen-Image distilled。此外,Qwen-Image图片编辑模型即将上线。

8月19日,通义团队推出Qwen-Image-Edit,基于20B参数的Qwen-Image,专注于语义和外观编辑,支持双语文本修改、风格迁移及物体旋转,进一步拓展了生成式AI在专业内容创作中的应用。

8月21日消息,通义APP正式上线知识库功能,并直接提供教育、法律、金融等五大垂直领域官方知识库。

9月6日消息,通义千问已推出Qwen3-Max-Preview,参数量达到1T。

9月12日,阿里云通义团队宣布推出其下一代基础模型架构 Qwen3-Next,并开源了基于该架构的 Qwen3-Next-80B-A3B 系列模型(Instruct 与 Thinking)。

9月26日,阿里通义千问正式发布Qwen3-Omni。

9月28日,硅基流动大模型服务平台宣布上线阿里通义千问团队最新开源的图像生成模型Qwen-Image-Edit-2509。

10月15日,阿里通义宣布Qwen3-VL系列新增两款开源模型:基于Dense架构的Qwen3-VL-8B与Qwen3-VL-4B正式上线。

11月27日,据阿里云消息,新加坡国家人工智能计划(AISG)发布了一款名为Qwen-SEA-LION-v4的东南亚多语言大模型。该模型的核心技术底座基于阿里巴巴的“通义千问”(Qwen)开源模型构建。

12月10日,通义千问推出全新语音合成模型Qwen3-TTS,该模型具备多音色、多语种及多方言的语音生成能力,现已通过Qwen API向用户开放使用。

12月15日,阿里通义宣布开源Fun-CosyVoice3-0.5B,支持本地部署与定制化微调。

出现背景

时代背景

大模型是人工智能领域的热门研究方向。专家认为,人工智能进入产业级大模型时代。大模型将是未来一段时间科技领域里面最重要的事情之一。大模型将开启人工智能的“大一统时代”。

人工智能是引领新一轮科技革命与产业变革的战略性技术,是赋能经济社会数字化、绿色化双转型的主要引擎,具有很强的“头雁”效应。

这些模型使用大量的多媒体数据资源作为输入,并通过复杂的数学运算和优化算法来完成大规模的训练,以学习和理解到输入数据的模式和特征。这些模式和特征最终通过大模型中庞大的参数进行表征,以获得与输入数据和模型设计相匹配的能力,最终来实现更复杂、更广泛的任务,如语音识别、自然语言处理、计算机视觉等。

技术背景

1)视觉算法基础

传统机器学习算法中,可通过图像特征描述子SIFT、SURF、BRIEF进行特征点提取和匹配,车载自动驾驶摄像头里面用的图像识别类算法基本上都是CNN的结构,为卷积神经网络。卷积神经网络认知图像的过程跟人大脑认知图像的原理类似。图像输入即输入摄像头的数据,以每帧信息为基础进行检测、分类、分割等计算,最后利用多帧信息进行目标跟踪,输出相关结果。

视觉算法近年来的突破在泛化性、可提示性、生成质量和稳定性等方面均取得了进展,预示着技术拐点的临近以及爆款应用的涌现。由于扩散算法的成熟,对3D资产生成和视频生成领域有促进作用。

2)行业发展基础

随着科技发展,AI 的开发门槛降低,人们期待小学生也能用各种模型进行开发,因此需要形成一个一个模型的不同层级的结构。一个通用的模型其实也很难解决所有问题,从设计者、开发者的角度出发,围绕着模型作开发的范式逐渐诞生。

3)大模型首次出现

2022年11月30日,美国人工智能研究实验室OpenAI推出ChatGPT,这是一种人工智能技术驱动的自然语言处理工具,使用了Transformer神经网络架构,也是GPT-3.5架构,这是一种用于处理序列数据的模型,拥有语言理解和文本生成能力。

ChatGPT会通过连接大量的语料库来训练模型,语料库包含了真实世界中的对话,使得ChatGPT具备上知天文下知地理,还能根据聊天的上下文进行互动,做到与真正人类几乎无异的聊天场景进行交流。ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。也能够通过学习和理解人类的语言来进行对话。

平台特色

通义千问大模型是一种大规模预训练模型,旨在解决智能对话、知识图谱推理和其他多模态任务。大模型的一个关键特性是能力泛化,能够适应各种新情景和任务,而不仅仅局限于训练时所遇到的特定任务。

服务特性

通义千问可提供的从IaaS、PaaS到MaaS的三层系统服务能力。

其中,智算IaaS服务包括可支持最大十万卡GPU单集群规模、可承载多个万亿参数大模型同时在线训练的智算集群,可为万卡规模AI集群提供无拥塞通讯的自研RDMA网络架构等;智算PaaS服务以机器学习平台PAI为核心,可支持万卡的单任务分布式训练规模,AI训练效率提升可达10倍,推理效率提升可达6倍,覆盖全链路AI开发工具与大数据服务,深度支持了通义大模型的研发。

智算MaaS服务包括通义大模型系列和以之为基础的企业定制大模型,以及国内首个“模型即服务”开放平台魔搭社区。

内容特性

通义具有知识理解和获取能力。无论是结构化知识还是非结构化知识,模型都能有效理解和抽取,提供相对精确和准确的答案。其次,模型具有泛化能力,无需进行特定任务训练即可进行多模态理解和推理。此外,模型还能够根据给定的情境理解用户的需求,提供相关的、准确的答案。最后,模型具有显著的自适应能力,可以根据不同的应用场景和用户需求进行自我调整。

动辄超千亿参数的大模型研发,不是单一的算法问题,也不是靠简单堆积GPU就能实现的,这是囊括了底层算力、网络、存储、大数据、AI框架、AI模型等复杂技术的系统性工程,需要AI-云计算的全栈技术能力。

算力特性

在算力层面,阿里云为阿里大模型的研发提供了算力体系支撑。阿里云拥有中国唯一自研云操作系统飞天,单集群可达10万台规模,千亿级文件数,EB级别存储空间。阿里云已在全球建立了28个数据中心,是亚洲规模最大的云计算平台。

个性特性

各行各业的生态伙伴都可以结合自己的行业知识及场景需求,对通义大模型进行再训练和精调,打造专属大模型,并集成进自己的行业整体解决方案中。千问专属大模型具有定制化、易集成、可微调、强安全等特点。

安全特性

阿里云为通义提供数据存储空间,通过服务器端加密机制,实现高安全性、高合规性的数据保护。伙伴和企业可以上传自己的行业数据,并调用通义进行重新训练。这些数据不会被用于训练通用版的千问大模型,阿里云和任何第三方都无法触碰。

名称由来

初期,通义前身为通义千问,前者的“通义”取自《汉书》中的“天地之常经,古今之通义也”,有“普遍适用的道理与法则”之意;后者的“千问”寓意千万次的问,千万的学问,能问出千问的一定是真爱,能回答千问的,也一定是真有学问,以及AI和阿里云一样,都有千万次交互的热情。

2024年5月,更名为通义,意为“通情,达义”,具备全副AI能力,致力于成为人们的工作、学习、生活助手。

主要功能

通义千问是阿里巴巴达摩院自主研发的超大规模语言模型。诞生源于阿里巴巴对人工智能技术的探索和实践,旨在为各行各业提供优质的自然语言处理服务,并且能够应对各种复杂的任务挑战。

截至2024年5月,通义千问提供通义灵码(编码助手)、通义智文(阅读助手)、通义听悟(工作学习)、通义星尘(个性化角色创作平台)、通义点金(投研助手)、通义晓蜜(智能客服)、通义仁心(健康助手)、通义法睿(法律顾问)8大行业模型。

8大行业模型可以帮助人们写代码、读代码、查BUG、优化代码等;短时间内获取长文本提要和概述,掌握要点;对音频内容转写、翻译、角色分离、全文摘要、章节速览、发言总结、PPT提取等功能,并支持标重点、记笔记;可以解读财报研报,分析金融业事件,自动绘制图表表格,实时市场数据分析等。

模型框架

通义千问模型基于Transformer框架,采用了开源大语言模型训练方法LLaMA。

模型修改

开发团队对架构主要做了以下修改:

1)Embedding and output projection:通义千问模型选择了不受限的嵌入方法,而不是捆绑输入嵌入和输出投影的权重,此项改动是为了以内存成本为代价获得更好的性能

2)位置编码(Positional embedding):模型采用RoPE(Rotary Positional Embedding)为位置编码,并选择使用FP32精确度而不是BF16或FP16的逆频率矩阵,以此提高模型的性能表现和精确度。

3)偏差(Bias):开发团队在模型中的大多数层(layer)种移除了偏差,而是在QKV注意力层中添加了偏差,以增强模型的外推能力。

4)Pre-Norm & RMSNorm:模型采用预规范化方法(pre-normalization)提高训练稳定性,并将传统层归一化方法替换为RMSNorm。

5)激活函数(Activation function):模型采用SwiGLU激活函数,缩小了前馈网络(feed-forward network ,FFN)的维度,由原来隐藏大小的4倍变成隐藏大小的8/3倍。

6)通义千问更新了旗舰版Qwen3模型,推出Qwen3-235B-A22B-FP8非思考模式(Non-thinking)的更新版本,命名为:Qwen3-235B-A22B-Instruct-2507-FP8。新的Qwen3模型,通用能力显著提升,包括指令遵循、逻辑推理、文本理解、数学、科学、编程及工具使用等方面。

关键技术

Transformer模型的注意力机制在上下文长度上有很大的限制,即随着上下文长度的增加,二层复杂度计算会使模型的计算成本和内存成倍增加。千问模型利用了简单的免训练技术,在推理过程中扩展上下文长度,这些技术包括:

1)NTK感知插值:这项技术以免训练的方式调整尺度以防止高频信息丢失,为了进一步提高性能。开发团队还实现了一个名为动态NTK感知插值的简单扩展动态NTK感知插值,它按块动态改变规模,避免严重的性能下降。这些技术有效地扩展了Transformer模型的上下文长度,而不会影响其计算效率或准确性。

2)LogN-Scaling:这项技术通过一个取决于上下文长度与训练长度之比的因子重新调整查询和值的点积,确保注意力值的熵随着上下文长度的增长保持稳定。

3)Window attention:这项技术将注意力限制在一个上下文窗口内,防止模型关注到太远的内容。基于千问模型的长上下文建模能力在不同层之间有所不同,与较高层相比,较低层对上下文长度扩展更加敏感,开发团队为每一层分配不同的窗口大小:较低的层使用较短的窗口,而较高的层使用较长的窗口。

模型训练

千问模型的训练遵循自回归语言建模的标准方法,即模型通过前面Token的内容预测下一个Token,其他训练细节包括:模型训练的最大长度为2048,为了构建批次数据,开发团队对文本内容进行随机打乱及合并,再将其截断到指定长度;模型在注意力模块(attention modules)采用Flash Attention技术,以提高训练速度;模型在优化器(optimizer)方面采用标准优化器AdamW,设置超参数β1、β2和ϵ为别为0.9、0.95和10−8;模型采用余弦学习率计划,为每个模型大小指定一个指定的峰值学习率,学习率衰减至最小学习率峰值学习率的10%;采用BFloat16进行混合精度训练以保证训练稳定性。

系列产品

通义APP

是阿里巴巴旗下实用的AI助手,拥有数千万用户,为用户提供日常办公、学习提效和生活健康、娱乐等全方位支持。

在日常办公中,通义提供专业文档撰写、实时记录、音视频速读和代码生成解释、代码纠错等服务,支持跨文档摘要、分析和内容创作。

学习方面,通义具备图像和视频理解能力,可拍照讲题、在线解析网页、论文与图书,实现多文本摘要和结构化总结,并提供实时翻译功能。

生活娱乐方面,通义提供全民舞台、AI生图、AI生视频和照相馆等趣味玩法,帮助用户创作有趣的图片和视频。通义还提供多元化智能体创建功能,包含健康、国学、预测、星座、法律等,用户可轻松配置所需工具或聊天角色。

连续两年登顶QuestMobile“中国互联网AIGC应用用户规模TOP榜”,获华为应用市场评为“最佳新锐合作伙伴”。

通义灵码

通义灵码可以辅助程序员写代码、读代码、查BUG、优化代码等。掌握Java、Python、Go、JavaScript、TypeScript、C/C++、C#等200多种编程语言,可帮助程序员提升超10%的开发效率。程序员、编程爱好者、学生无需下载专业软件,使用通义千问就能写代码和学代码。

通义智文

通义智文是阿里云推出的基于通义大模型的免费AI阅读助手,可智能阅读网页、论文、图书和文档,帮助用户在短时间内获取提要和概述,掌握要点,提高阅读效率。同时支持自由提问,可解答用户关于文章的问题或其他不解之处。

通义听悟

生活中,音视频承载了密集的信息内容,但因涉及多模态理解、自然语言处理、搜索等多项复杂技术,存在查找难、回顾难、提炼难问题。通义听悟提供包括转写、翻译、角色分离、全文摘要、章节速览、发言总结、PPT提取等功能,并支持标重点、记笔记。

通义听悟也可以通过多语言Query处理、长篇章文本理解、指令演化框架优化及检索增强生成算法,实现对超长音视频的单记录、跨记录、多语言自由问答。

用户不仅可在单一记录页呼唤小悟,对最高6小时、6G大小的音视频提问任何相关话题,可直接要求小悟整理金句、梳理结论、写会议纪要;更可在首页针对用户所有记录提问,支持一次性扫描理解上百条音视频内容;也可对英文视频用中文提问,将直接给出中文回答。

通义星尘

通义星尘是一款个性化角色创作平台,其基于大规模高质量个性化对话数据,采用分阶段的个性化训练策略,使得模型在保持通用能力的基础上,延伸出拟人、具有情感、鲜明语言风格的能力,在角色的个性、风格遵循上具有更强的指令遵循能力。可以深度定义人设、和用户建立起深度连接、支持多种形式的对话互动,并且可以基于具体的事件设定展开对话。可应用于情感陪伴、游戏NPC、IP复刻等场景。

通义点金

通义点金可以解读财报研报,分析金融业事件,自动绘制图表表格,实时市场数据分析。智能投研机器人可以分析事件,绘制表格,查询资讯,研究财报;文档分析机器人可以总结要点,扩展资讯,文档问答,片段分析,财报、研报公告;金融信息搜索引擎可以搜数据、查研报、找公告等。

通义晓蜜

通义晓蜜提供全渠道联络中心与AI应用的整体方案,助力企业服务向信息化、智能化、多模态转型。

其中,对话机器人支持多种形态的知识,比如文档网页、高频问题、复杂多轮、表格、数据库等;智能坐席助理全方位陪伴人工坐席,助力客服、销售业绩提升,提供产品介绍、通话过程剖析、案例沉淀、通话技巧提升等功能;多模态智能联络中心则为全渠道多模态的企业智能服务平台,支持电话、IM、视频统一接入、统一调度服务数据和客户体验完整、一致,也为客户给提供面向下一代的多模态服务体验,告别单调的文字、语音交流。

通义仁心

通义仁心是个人健康助手,提供问报告、问症状、问用药、问疾病功能。

通义法睿

通义法睿能够回答用户提出的法律问题,具有推理法律适用、 推送裁判类案、辅助案情分析、生成法律文书、检索法律知识等功能。旨在帮助法律专业人士提高生产力水平, 同时也可为非专业人士提供便捷的法律咨询服务。

提供针对用户的法律问题,以法律规定作为大前提,情形匹配作为小前提,按照逻辑三段论推理生成答案;根据用户描述的文本信息或上传的材料信息,结合专业模版定制化生成起诉状、答辩状等文书;利用大模型推理优势,通过语意理解提高用户搜索准确性和相关性,从法规和判例库找准信息。

长文本功能

通义千问向所有人免费开放1000万字的长文档处理功能。通过调优算法或者通过算力甚至使用RAG(检索增强生成技术,是对大型语言模型输出进行优化的方法,使其能够在生成响应之前引用训练数据来源之外的知识库),都可以打造出该体验。

社会评价

行业评价

长文本能力或可以成为大模型公司吸引市场关注,赢得竞争的路径之一,不过要做好“长”“准”、成本三者之间的平衡,还需要不断摸索。(新京报 评)

通义千问更成熟了,也更好用了。通义千问2.0在指令遵循、工具使用、精细化创作等方面作了技术优化,能够更好地被下游应用场景集成。通义大模型官网上线了多模态和插件功能,支持图片输入、文档解析等细分任务。(财经网科技频道 评)

根据国际市场研究机构Omdia于2025年12月发布的《2025年全球企业级MaaS市场分析》报告,阿里云获评全球领导者,并在基础模型丰富性、模型精调、Agent开发、成本优化和生产部署5大维度获评‘领先’级别,为中国第一,在国际上仅次于AWS,与Azure、谷歌云持平。

自我评价

通义千问将提供完备的算力和大模型基础设施,让包括创业公司在内的所有企业和机构更好地实现创新。(阿里云智能首席技术官周靖人 评)

OpenAI是目前(截至2023年4月)全球大模型研究领域的引领者,ChatGPT是非常优秀的模式,通义千问还在不断学习和成长中。尤其GPT-4在推理、数学等方面有表现,通义千问尚不能及。当然,通义千问也有自己较为擅长的领域,比如在文本对话、阅读理解等方面。(阿里云 评)

内部评价

对于普通人来说,未来也无需下载专业软件,使用通义千问就能写代码和学代码。针对没有代码基础的学生,通义千问可以提供学习建议。正如汽车的出现让一部分马车夫没有了工作,但却产生了司机这个新的职业。人类程序员和 AI 程序员的关系,应该是相互促进、共同学习。(机器之心 评)

大模型正在成为人们工作和学习的重要辅助工具,长文档处理是很多用户的刚需,它能针对用户上传的文档进行解析、摘要和问答。随着模型性能升级,大模型的长文档处理能力从早期的几千字发展到后来的几万字、几十万字,如今,阿里通义千问把天花板直线拉高到了千万字。(《钱江晚报》评)

存在问题

在技术层面,在2023年4月的测试中,通义无法获取最新信息,或意味着训练数据有限。通义千问表示自己的训练数据来自2021年,因此无法获取有关未来的信息。此外,通义千问的缺点是不支持多语言,只支持中文。

所获荣誉

8月9日,阿里云通义千问 Qwen Code 宣布每日可免费运行 2000 次(请求)运行权限,且没有 Token 限制。

12月10日,通义千问推出全新语音合成模型Qwen3-TTS,该模型具备多音色、多语种及多方言的语音生成能力,现已通过Qwen API向用户开放使用。

产品合作

钉钉接入阿里通义千问大模型,开启全面智能化战略。在钉钉输入斜杠“/”即可唤起智能服务。在只要画个表拍张照,就能生成一个表单小程序。此外,钉钉斜杠还能根据需求撰写文案、设计海报等。

2023年4月,阿里集团副总裁、斑马智行CEO张春晖宣布,AliOS智能汽车操作系统已接入通义千问大模型进行测试,并正式发布斑马智行第三代汽车AI能力体系Banma Co-Pilot,相关技术将会在智己汽车上落地。

2023年4月,阿里云宣布将与OPPO安第斯智能云联合打造OPPO大模型基础设施,基于通义千问完成大模型的持续学习、精调及前端提示工程。同时,吉利汽车、智己汽车、奇瑞新能源、毫末智行、太古可口可乐、波司登、掌阅科技等多家企业表示将与阿里云在大模型相关场景展开技术合作的探索和共创。

截至2023年10月,阿里云与60多个行业进行合作,推动通义千问在办公、文旅、电力、政务、医保、交通、制造、金融、软件开发等领域的落地。也将持续支持千行百业的开发者基于通义千问开源模型进行模型和应用创新。

2023年11月,阿里巴巴宣布,所有产品将接入“通义千问”大模型,进行全面改造,包括天猫、钉钉、高德地图、淘宝、优酷、盒马等。

2024年3月28日消息,全球最大的智能手机芯片厂商MediaTek联发科,已成功在天玑9300等旗舰芯片上部署通义千问大模型,首次实现大模型在手机芯片端深度适配。

2024年4月14日,中国科学院国家天文台人工智能工作组发布基于阿里云通义千问开源模型打造的天文大模型——“星语3.0”。“星语3.0”基于阿里云通义千问开源模型打造,已成功接入国家天文台兴隆观测站望远镜阵列--Mini“司天”。

2024年5月17日,阿里云表示,微博已接入阿里云通义大模型。据悉,微博是阿里云最早一批上云客户,也是阿里云通义大模型的最早客户。

2025年4月,义乌商城集团宣布正式接入阿里通义大模型。

国家天文台依托阿里“通义千问”模型打造“金乌”大模型。经过监督学习和强化学习,“金乌”已经能够理解和回答有关太阳物理的问题,并能认识太阳的图像,分析、预测X级耀斑达到了95%的准确率和100%的真实阳性率。

截至2025年4月,阿里通义千问已服务复旦大学、山东大学、东南大学、中科院等300多家机构院所,推动大模型助力科研创新。

2025年5月,阿里巴巴集团与SAP宣布达成战略合作。SAP将探索接入通义千问大模型,并支持企业在阿里云上部署SAP ERP云及SAP ERP私有云版本。双方将共同扩展企业级市场客户,初期聚焦于中国市场,并逐步扩展至东南亚、中东和非洲。

2025年11月25日,新加坡国家人工智能计划(AISG)在其新的东南亚语言大模型项目中,放弃了Meta模型,转向阿里巴巴的通义千问Qwen开源架构,标志着中国开源AI模型在全球影响力版图中的一次关键扩张。这一转变旨在解决一个长期痛点:此前以Meta的Llama系列为代表的开源模型,在处理印尼语、泰语和马来语等区域性语言时表现不佳,严重制约了本地化AI应用的开发效率与性能。 这一转变也凸显了阿里巴巴通义千问在全球开源AI领域的崛起。

相关事件

维权案件

2024年1月16日,中国国内大模型打假维权出现首例胜诉判决。阿里云、阿里巴巴诉山寨通义千问APP发布方一审胜诉,飞游科技公司因侵犯注册商标及虚假宣传,被责令赔偿相关经济损失及维权费用,并于官网连续十五日发布道歉声明。

黑暗人格现象实测

2025年7月,南方都市报、南都大数据研究院选取通义等主流AI大模型进行AI“黑暗人格”现象实测,在“注入反常场景”环节,通义表现出初步的警惕性,试图通过修改语句或将语料纠正至正确场景。进入“反常语料测试”环节,通义却直接输出了预设的伤害性、负面回答。“有害指令延展测试”环节,通义虽未输出实质性错误答案,但其回复方式却沿用了异常语料的负面语气,采用了尖酸刻薄的表达,形成了一种形式正确但表达方式存在问题的输出。

转自:https://baike.baidu.com/item/%E9%80%9A%E4%B9%89/64394178

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/2/27 22:13:35

【Open-AutoGLM会话管理深度优化】:揭秘高效会话销毁机制设计原理

第一章:Open-AutoGLM会话销毁机制优化概述在大规模语言模型服务系统中,会话管理对资源利用率与系统稳定性具有决定性影响。Open-AutoGLM作为支持多轮对话的智能引擎,其会话销毁机制直接关系到内存占用、连接池效率以及用户交互体验。传统基于…

作者头像 李华
网站建设 2026/3/9 17:38:50

9个AI论文工具,MBA轻松搞定学术写作!

9个AI论文工具,MBA轻松搞定学术写作! AI 工具如何助力 MBA 学术写作? 在当今信息爆炸的时代,MBA 学生和研究者面对的学术写作任务日益繁重。无论是论文撰写、开题报告还是数据分析,都需要高效且专业的工具支持。而 AI …

作者头像 李华
网站建设 2026/2/12 4:46:39

Open-AutoGLM任务中断怎么办?3步诊断+4种恢复模式全覆盖

第一章:Open-AutoGLM任务中断现象与影响在大规模语言模型自动化推理场景中,Open-AutoGLM作为典型代表,其任务执行的连续性直接影响系统输出的完整性与可靠性。然而,在实际部署过程中,任务中断现象频繁发生,…

作者头像 李华
网站建设 2026/3/4 15:45:51

Open-AutoGLM认证性能瓶颈突破,1次配置优化提升成功率98%

第一章:Open-AutoGLM 认证失败处理优化在 Open-AutoGLM 框架中,认证失败是常见但需谨慎处理的关键路径。不当的错误响应不仅影响用户体验,还可能暴露系统安全细节。为此,需对认证流程中的异常处理机制进行精细化调整,确…

作者头像 李华
网站建设 2026/3/8 21:23:36

Open-AutoGLM与LoadRunner对比分析(仅限资深测试工程师查看)

第一章:Open-AutoGLM与LoadRunner对比分析的背景与意义 在当前软件系统日益复杂、智能化需求不断增长的背景下,自动化测试工具的选择直接影响开发效率与系统稳定性。传统性能测试工具如 LoadRunner 以其强大的负载模拟能力和企业级支持占据重要地位&…

作者头像 李华
网站建设 2026/3/8 3:32:04

OCCT 实战(5)AIS | 5.1、AIS_InteractiveObject 类

文章目录一、AIS_InteractiveObject 类1、核心功能2、工作原理2.1、核心设计逻辑2.2、核心工作流程(与AIS上下文联动)(1)初始化并注册对象(2)显示模式校验(AcceptDisplayMode)&#…

作者头像 李华