news 2026/5/10 1:14:57

面向参数高效边缘语言模型的正交基分解映射

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
面向参数高效边缘语言模型的正交基分解映射

正交基分解
作者:李金雨

标题建议

《OBDM: Orthogonal Basis Decomposition Mapping for Parameter-Efficient Edge Language Models》

中文标题:《OBDM:面向参数高效边缘语言模型的正交基分解映射》


摘要 (Abstract)

大型语言模型在移动设备和边缘计算场景中的部署受限于巨大的参数量和计算需求。本文提出正交基动态分解映射(Orthogonal Basis Decomposition Mapping, OBDM),一种通过低维正交基压缩全局特征交互的新型机制。OBDM将序列特征投影到一组可学习的正交基上,在基空间完成特征变换后反投影回原空间,将复杂度从O(n²d)降至O(nkd),其中k为基数量(k << n)。与标准自注意力相比,OBDM减少75%的参数量,在保持95%以上性能的同时实现3-5倍推理加速。实验表明,OBDM在端侧问答、设备端翻译等任务上达到与标准Transformer相当的准确率,为资源受限场景下的大模型部署提供了可行方案。

关键词:边缘计算、模型压缩、正交基、轻量化、移动NLP


1. 引言 (Introduction)

1.1 研究背景

  • 大模型在移动设备上的需求增长(手机助手、离线翻译)
  • 标准Transformer的参数量和计算开销
  • 现有压缩方法的局限性(量化损失、剪枝不稳定)

1.2 核心思想

  • 从"全连接"到"低维投影"的范式转变
  • 正交基的正则化作用
  • 可控的复杂度-性能权衡

1.3 主要贡献

  1. 提出OBDM机制,首个基于正交基的序列特征交互方法
  2. 理论证明正交约束下的特征保持能力
  3. 在端侧设备上实现3-5倍加速,参数量减少75%
  4. 开源边缘友好的模型实现

2. 相关工作 (Related Work)

2.1 模型压缩

  • 知识蒸馏 (Hinton et al., 2015)
  • 量化 (Jacob et al., 2018)
  • 剪枝 (Han et al., 2015)

2.2 高效Transformer

  • MobileBERT (Sun et al., 2020)
  • DistilBERT (Sanh et al., 2019)
  • TinyBERT (Jiao et al., 2020)

2.3 低秩近似

  • Linformer (Wang et al., 2020)
  • Low-Rank Transformer (Winata et al., 2020)
  • Tensor-Train Decomposition

2.4 与现有方法的区别

  • OBDM使用可学习正交基,而非固定投影
  • 正交约束提供理论保证
  • 支持端到端训练,无需预训练大模型

3. 方法 (Method)

3.1 问题定义

标准自注意力:

Attention(Q,K,V) = softmax(QK^T/√d)V 参数: 4d² (Q,K,V,O投影) 计算: O(n²d)

OBDM的目标:

在O(nkd)复杂度下实现全局交互,k << n 减少参数量,保持表达能力

3.2 正交基理论基础

3.2.1 正交基定义
B = [b_1, b_2, ..., b_k] ∈ R^{d×k} 满足: B^T B = I_k (正交性)
3.2.2 投影与反投影
# 投影到基空间C=X · B# [n, d] @ [d, k] = [n, k]# 在基空间变换C'=Transform(C)# [n, k]# 反投影回原空间Y=C' · B^T# [n, k] @ [k, d] = [n, d]

3.3 OBDM架构

3.3.1 可学习正交基
classOrthogonalBasis(nn.Module):def__init__(self,d_model,num_bases):super().__init__()
版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/10 1:11:48

2026 国内大模型 API 中转选型笔记:从接入成本到长期维护的几个观察

国内团队接入大模型,第一步通常不是写代码,是选入口。 官方接口能不能稳定访问、能不能人民币结算、后面要不要同时调 Claude、GPT、Gemini、DeepSeek、Kimi——这些问题不在选型阶段想清楚,半年后大概率要重新换一遍。 这篇笔记不打算给某一家平台站台,只整理一份相对完整的选…

作者头像 李华
网站建设 2026/5/10 1:04:41

如何创建一个 Springboot Starter

1.创建一个 空项目 xxx-spring-boot-starter 作为场景启动器&#xff0c;方便别人引用2. 创建 xxx-spring-boot-autoconfigure&#xff1a;包含自动配置类、属性类、核心服务等3.注册自动配置&#xff08;Spring Boot 2.7 / 3.x&#xff09;在 resources 目录下创建&#xff1a…

作者头像 李华
网站建设 2026/5/10 0:51:00

AI科研合作网络中的性别差异与核心地位获取因素分析

1. 项目概述&#xff1a;当AI遇上科研合作&#xff0c;性别差异如何影响“核心圈”&#xff1f;最近和几位在国内外顶尖高校做AI研究的朋友聊天&#xff0c;话题不自觉地就绕到了“圈子”上。大家普遍感觉&#xff0c;在人工智能这个看似前沿、开放的领域里&#xff0c;科研合作…

作者头像 李华
网站建设 2026/5/10 0:49:35

2026年AIGemini 3.1 Pro赋能无障碍交互新突破

在 2026 年&#xff0c;AI 已经从单纯的内容生成&#xff0c;逐步进入到更多需要理解场景、支持交互、辅助表达的细分领域。比如无障碍交互、辅助沟通、智能终端接入等任务&#xff0c;过去往往依赖专门的硬件和定制开发&#xff0c;现在则可以借助 Gemini 3.1 Pro 这类模型先做…

作者头像 李华
网站建设 2026/5/10 0:45:14

通过curl命令快速测试Taotoken的聊天补全接口是否通畅

&#x1f680; 告别海外账号与网络限制&#xff01;稳定直连全球优质大模型&#xff0c;限时半价接入中。 &#x1f449; 点击领取海量免费额度 通过curl命令快速测试Taotoken的聊天补全接口是否通畅 对于开发者与运维人员而言&#xff0c;在集成新的API服务时&#xff0c;一个…

作者头像 李华
网站建设 2026/5/10 0:37:46

CANN/atvoss Muls算子样例

Muls算子样例 【免费下载链接】atvoss ATVOSS&#xff08;Ascend C Templates for Vector Operator Subroutines&#xff09;是一套基于Ascend C开发的Vector算子库&#xff0c;致力于为昇腾硬件上的Vector类融合算子提供极简、高效、高性能、高拓展的编程方式。 项目地址: h…

作者头像 李华