news 2026/6/16 17:52:37

对比学习2:【MoCo】

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
对比学习2:【MoCo】

🚩 SimCLR 模型进阶版——MoCo模型笔记它来咯!
何凯明大佬之作。创新之处:1. 一个样本与多个样本一同对比; 2. 采用动量更新,即:指数滑动平均(EMA)


文章目录

  • 1. 一句话概括
  • 2. 创新点
  • 3. 具体方法
  • 4. 模型优缺点
    • 4.1 优点
    • 4.2 缺点
    • 4.3 MoCo vs SimCLR
    • 4.4 MoCo v1 / v2 的差别

1. 一句话概括

MoCo 模型(Momentum Contrast,动量对比学习),它是自监督学习在计算机视觉领域的里程碑之一,由 Kaiming He 团队在 2019 年提出,旨在解决 SimCLR 对大 batch size 的依赖问题,通过引入动量更新的编码器队列,在小 batch 甚至单卡环境下也能进行有效的对比学习。

  • 原论文:《Momentum Contrast for Unsupervised Visual Representation Learning》
  • 仓库地址:https://github.com/facebookresearch/moco

2. 创新点

用一个动态的“队列(Queue)”来存储过去多个 batch 的样本特征作为负样本,从而摆脱对大 batch 的依赖,同时用“动量更新”保持编码器的稳定性。

  1. 负样本不一定要来自当前 b a t c h 负样本不一定要来自当前 batch负样本不一定要来自当前batch
  2. 可以维护一个跨 b a t c h 的特征字典 可以维护一个跨 batch 的特征字典可以维护一个跨batch的特征字典
  3. 动量编码器:用于生成队列中的特征,其参数缓慢跟随主编码器更新,保证特征的一致性。 动量编码器:用于生成队列中的特征,其参数缓慢跟随主编码器更新,保证特征的一致性。动量编码器:用于生成队列中的特征,其参数缓慢跟随主编码器更新,保证特征的一致性。
    (字典里的特征要“一致”,否则旧特征和新特征分布不一致会影响训练)

3. 具体方法

MoCo整体框架:

  • Query Encoder(图左):编码当前样本得到 query 特征 q
  • Key Encoder(Momentum Encoder)(图右):编码增强后的样本得到 key 特征 k
  • Queue(特征队列):保存最近很多个 key 特征,作为负样本集合

MoCo采用的损失,依旧是 InfoNCE :

动量编码器:


如果队列里存的是“旧 batch 的特征”,编码器参数在不断更新,会导致:

  1. 队列里的 key 用“旧编码器”得到
  2. 当前 query 用“新编码器”得到
  3. 特征空间漂移,队列失效

MoCo 的解决方案:Key encoder 不用反向传播更新,而是用 query encoder 的参数做 EMA(指数滑动平均)更新,如上式。

4. 模型优缺点

4.1 优点

  1. 不需要超大 batch
  2. 负样本数量大且稳定
  3. 训练更可扩展(队列长度可控)

4.2 缺点

  1. 结构更复杂(双编码器、队列同步)
  2. 队列可能包含“过旧”样本(分布可能滞后),需要动量缓解
  3. 仍存在假负样本问题(负样本可能同语义)

4.3 MoCo vs SimCLR

相同点:

  • 都是对比学习:正样本为同图两视图;用 InfoNCE

不同点:

  • SimCLR:负样本来自 batch → 需要大 batch
  • MoCo:负样本来自 queue → 小 batch 也能有大量负样本

  • SimCLR:单编码器
  • MoCo:双编码器(query / momentum key)

4.4 MoCo v1 / v2 的差别

MoCo v1

  • 基本框架:动量编码器 + 队列

  • backbone:ResNet

  • 主要贡献:用队列解决大 batch 依赖

MoCo v2(更常用)

  • 在 MoCo v1 基础上引入 SimCLR 的一些“经验增强”,显著提升效果:

    • 更强的数据增强(颜色扰动、模糊等)

    • 使用 2-layer MLP 投影头

    • 调整温度、训练细节

结论:MoCo v2 ≈ MoCo + SimCLR tricks

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/15 17:28:16

港科大ORCA框架:视频角色实现自主复杂任务执行

这项由香港科技大学何轩华、杨天宇和陈启峰教授领导,联合美团研究团队共同完成的研究发表于2024年12月,论文编号为arXiv:2512.20615v1。有兴趣深入了解的读者可以通过该编号查询完整论文。当我们观看一个视频博主制作美食的过程时,会发现他们…

作者头像 李华
网站建设 2026/6/13 1:54:45

基于SpringBoot的音乐网站设计与实现(毕设源码+文档)

背景 本课题聚焦音乐传播与分享的数字化需求,针对当前音乐资源分散、个性化推荐不足、交互体验单一、版权管理不规范等痛点,设计开发基于SpringBoot的音乐网站。网站以SpringBoot为核心后端框架,结合前端主流开发技术与数据库存储方案&#x…

作者头像 李华
网站建设 2026/6/16 16:17:43

ARM 汇编指令:STP\LDP

ARM 汇编指令:STP\LDP 好的,STP 和 LDP 是 ARMv8-A 架构中非常核心且高效的一对指令,用于同时存储/加载两个寄存器。它们对栈操作、函数调用约定和内存数据块操作至关重要。 核心概念 STP:Store Pair。将两个寄存器的值存储到相邻…

作者头像 李华
网站建设 2026/6/10 20:27:35

基于微信小程序的智能雨伞借取系统毕设源码+文档+讲解视频

前言 本课题聚焦公共出行场景下的应急借伞需求,针对传统共享雨伞借还流程繁琐、点位信息不透明、归还不便、管理效率低下等痛点,设计开发基于微信小程序的智能雨伞借取系统。系统以微信小程序为核心载体,结合前端原生开发技术与后端轻量化服务…

作者头像 李华
网站建设 2026/6/10 20:39:05

2025最强AI写论文神器:8款工具一键搞定降重润色!

别再为论文熬夜、为查重焦虑、为导师意见抓狂了。这篇终极清单,将彻底改变你的学术写作方式。 在学术写作的世界里,时间就是生命,质量就是尊严。从开题报告到文献综述,从数据处理到最终查重,每一步都充满挑战。但今天&…

作者头像 李华
网站建设 2026/6/12 13:07:02

PMP学习笔记--环境

01,组织运行环境包含事业环境因素和资质过程资产组织结构类型(1)职能型组织(2)矩阵型组织(3)项目型组织项目管理者在不同组织中的特征组织治理框架法约尔原则与治理要素企业文化与发展战略企业所…

作者头像 李华