news 2026/3/13 4:38:24

2025ICLR-Honorable Mentions-DATA SHAPLEY IN ONE TRAINING RUN

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
2025ICLR-Honorable Mentions-DATA SHAPLEY IN ONE TRAINING RUN

文章核心总结与创新点

主要内容

本文针对传统Data Shapley在大规模模型中存在的计算效率低、无法评估特定训练过程数据贡献的问题,提出了In-Run Data Shapley方法。该方法无需重复训练模型,通过在单次训练过程中累加各梯度更新迭代的Shapley值,实现对数据贡献的高效评估。文章通过理论推导(泰勒展开近似)和技术优化(幽灵点积、幽灵梯度-海森-梯度积技术),使方法在基础模型预训练场景中具备可行性,并通过实验验证了其在数据筛选、训练阶段贡献分析、生成式AI版权相关研究中的应用价值。

创新点

  1. 概念创新:提出In-Run Data Shapley,首次实现对特定训练过程的数据贡献评估,突破传统方法针对通用学习算法的局限,贴合实际部署需求。
  2. 效率优化:基于泰勒展开将全局效用分解为单迭代局部效用,结合“幽灵”系列技术,在单次训练中完成计算,一阶近似与常规训练耗时接近,二阶近似仅增加一倍耗时,远超传统方法效率。
  3. 应用拓展:首次将数据归因应用于基础模型预训练,揭示数据贡献的阶段依赖性、高质量数据集仍存在16%低价值数据等新洞察,为数据筛选和生成式AI版权分配提供理论支持。

翻译部分(Markdown格式)

Abstract

数据沙普利(Data Shapley)提供了一个原

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/3/10 23:16:20

使用es客户端进行日志告警触发:完整示例

用代码“监听”日志:如何通过 Elasticsearch 客户端实现高精度告警 你有没有遇到过这样的场景? 凌晨两点,手机突然震动。打开一看,是运维同事发来的消息:“服务崩了,ERROR 日志刷屏,但我们是两…

作者头像 李华
网站建设 2026/3/7 11:26:18

L298N电机驱动模块入门实践:PWM调速从零实现

从零开始玩转L298N:用PWM实现直流电机平滑调速你有没有试过让一个小车从静止缓缓加速,像电影里的机器人一样优雅启动?或者控制机械臂缓慢下降,避免“哐当”一声砸到桌面?这些流畅动作的背后,离不开一个看似…

作者头像 李华
网站建设 2026/3/12 22:50:06

Keil uVision5安装教程:实现电机控制项目的从零实现

从零搭建电机控制开发环境:Keil uVision5 安装与实战配置全解析 你是否曾在深夜调试电机代码时,突然被“License not found”或“Pack Installer failed”这样的错误拦住去路? 你是否刚入手一块STM32开发板,满心期待实现FOC算法…

作者头像 李华
网站建设 2026/3/12 9:49:36

FCKEditor实现WORD公式粘贴支持Latex公式导入

要求:免费,开源,技术支持 编辑器:xhEditor 前端:vue2,vue3,vue-cli,html5 后端:java,jsp,springboot,asp.net,php,asp,.net core,.net mvc,.net form 功能:导入Word,导入Excel,导入PPT(PowerPoi…

作者头像 李华
网站建设 2026/3/12 13:39:45

anything-llm使用技巧:提升文档上传与检索效率的5个方法

Anything LLM 使用技巧:提升文档上传与检索效率的 5 个方法 在智能问答系统逐渐成为知识管理标配的今天,一个常见的痛点浮出水面:为什么我上传了几十页的技术手册,AI 却总是“视而不见”?或者,明明文档里有…

作者头像 李华
网站建设 2026/3/12 20:55:46

esp32连接onenet云平台定时上传功能实现

ESP32连接OneNet云平台实现定时上传:从零构建稳定物联网数据链路 你有没有遇到过这样的场景? 部署在农田里的温湿度传感器,每天要手动去读一次数据;楼顶的空气质量检测仪偶尔断线,后台就再也收不到更新……这些“半自…

作者头像 李华