ERNIE 4.5-A3B开源：210亿参数文本生成新突破！-开发者社区

ERNIE 4.5-A3B开源：210亿参数文本生成新突破！

【免费下载链接】ERNIE-4.5-21B-A3B-Base-Paddle项目地址: https://ai.gitcode.com/hf_mirrors/baidu/ERNIE-4.5-21B-A3B-Base-Paddle

百度ERNIE系列再添新成员，ERNIE-4.5-21B-A3B-Base-Paddle模型正式开源，以210亿总参数、30亿激活参数的MoE架构，为文本生成领域带来高效能新选择。

近年来，大语言模型正朝着"更大参数、更高效率"的方向快速演进。混合专家模型（Mixture of Experts, MoE）凭借其"总量大、激活小"的特性，成为平衡性能与计算成本的优选方案。据行业研究显示，2024年MoE架构模型在高性能LLM市场的占比已提升至35%，相比传统密集型模型平均降低40%的推理成本。在此背景下，百度推出ERNIE-4.5系列的轻量化文本专用版本，进一步丰富了大模型应用生态。

该模型的核心优势集中体现在三个维度：首先是高效能MoE架构，采用64个文本专家+2个共享专家的设计，每个token仅激活6个专家，在210亿总参数规模下实现30亿激活参数的轻量化推理，显著降低硬件门槛；其次是超长文本处理能力，支持131072 tokens（约26万字）的上下文窗口，可满足长文档理解、代码生成等复杂场景需求；最后是全栈式技术优化，基于PaddlePaddle框架实现异构混合并行训练，结合FP8混合精度、卷积码量化等技术，实现4-bit/2-bit无损量化推理，部署效率较同类模型提升30%。

从技术架构看，ERNIE-4.5-A3B采用三阶段训练策略：前两阶段专注文本参数训练，奠定语言理解基础；第三阶段引入视觉模态协同优化，最终提取文本专用参数形成当前开源版本。这种设计既保留了多模态训练带来的性能增益，又确保文本任务的纯粹性。模型同时提供完整工具链支持，通过ERNIEKit可实现LoRA微调、DPO对齐等功能，FastDeploy部署工具则支持80G单卡环境下的高效服务，降低企业级应用门槛。

此次开源将加速大模型在垂直领域的落地进程。对开发者而言，210亿参数级别的MoE模型开源填补了中等规模高性能模型的空白，尤其适合金融、法律等需要长文本处理的专业场景；对行业生态而言，基于PaddlePaddle的全栈技术方案为国产大模型软硬件协同提供参考范例；对终端用户而言，更高效的推理性能意味着更低的应用成本和更流畅的交互体验。随着技术文档、社区支持的完善，ERNIE-4.5-A3B有望成为继ERNIE 3.0后又一标杆性开源模型。

在大模型技术日趋成熟的今天，ERNIE-4.5-A3B的开源不仅展现了百度在MoE架构上的技术积累，更推动了大模型从"追求参数规模"向"注重实用效率"的产业转型。未来，随着量化技术的进一步突破和硬件适配的完善，这类高效能模型或将成为企业级应用的主流选择，加速AI技术在千行百业的深度渗透。

【免费下载链接】ERNIE-4.5-21B-A3B-Base-Paddle项目地址: https://ai.gitcode.com/hf_mirrors/baidu/ERNIE-4.5-21B-A3B-Base-Paddle

创作声明：本文部分内容由AI辅助生成（AIGC），仅供参考

腾讯开源翻译模型案例：新闻媒体多语言发布系统

腾讯开源翻译模型案例：新闻媒体多语言发布系统随着全球化信息传播的加速，新闻媒体对高效、精准的多语言翻译需求日益增长。传统翻译服务在成本、延迟和定制化方面存在诸多瓶颈，尤其在处理混合语言、专业术语和实时发布场景时表现乏力。腾讯…

李华

利用proteus仿真51单片机实现窗帘自动控制：项目应用

从零开始用Proteus仿真51单片机实现窗帘自动控制：实战详解与避坑指南你有没有遇到过这样的情况？想做一个智能窗帘项目，但刚焊完电路板，电机一转就烧了驱动芯片；或者反复调试代码，却分不清问题是出在程序逻辑…

李华

JLink驱动安装失败排查：核心要点深度剖析

JLink驱动装不上？别急，先搞懂这5个致命环节你有没有遇到过这种情况： 项目正卡在关键调试阶段，手一插J-Link，设备管理器里却只显示一个黄色感叹号 ； 或者明明运行了安装包，Keil、IAR这些I…

李华

STM32CubeMX使用教程：主时钟MCO输出调试技巧

STM32时钟调试神技：用MCO输出STM32CubeMX快速定位时钟问题你有没有遇到过这样的场景？系统上电后程序卡死，HAL_Init()里迟迟不返回；ADC采样频率莫名其妙偏移了10%；从Stop模式唤醒失败，但代码逻辑看起来完全没…

李华

HY-MT1.5翻译模型对比分析：1.8B与7B版本如何选择

HY-MT1.5翻译模型对比分析：1.8B与7B版本如何选择在大模型驱动的自然语言处理时代，高质量、低延迟的机器翻译需求日益增长。腾讯近期开源了混元翻译大模型 1.5 版本（HY-MT1.5），包含两个核心变体：HY-MT1.5-…

李华

RaNER模型实战：新闻事件实体关系抽取案例

RaNER模型实战：新闻事件实体关系抽取案例 1. 引言：AI 智能实体侦测服务的现实需求在信息爆炸的时代，新闻文本、社交媒体内容和公开报告中蕴含着海量的非结构化数据。如何从中快速提取出关键信息——如涉及的人物、地点、组织机构及其相互关…

李华