news 2026/4/15 16:34:48

监督学习训练图像聚类模型,性能大幅提升

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
监督学习训练图像聚类模型,性能大幅提升

使用监督学习训练图像聚类模型

在机器学习领域,大多数模型都依赖于监督学习,需要耗费高昂成本和时间来获取带标注的数据。无监督学习的主要方法——聚类,旨在根据显著特征将数据点分组,每个组(簇)代表一个类别,例如同一人物的照片或同一物种的动物图像。

传统的聚类算法通常依赖启发式规则来决定簇之间的边界,例如簇中心之间的阈值距离或簇的分布形状。在一篇提交给国际计算机视觉大会(ICCV)的论文中,提出了一种新方法:直接从数据中学习如何划分边界。

核心方法:分层图神经网络

该方法首先将视觉数据表示为一个,其中每个节点代表一张图像,每个节点与其在特征空间中的k个最近邻节点相连。

然后,使用一个图神经网络来生成图中节点的向量表示(节点嵌入)。与先前工作不同的是,该方法不依赖启发式规则,而是使用带标签的元训练数据来学习如何对这些向量进行聚类,并决定聚类的精细程度。

该方法的核心创新在于其分层处理方式。聚类模型基于节点嵌入预测节点之间的连接边,共享边的节点组被定义为一个簇。完成一层聚类后,将每个簇聚合成一个代表该簇的“超节点”,然后在新的超节点图上重复整个过程:构建k最近邻图,通过GNN传递,并预测超节点之间的连接边。这个过程迭代进行,直到模型不再预测出新的连接边为止。

模型训练与优势

该聚类模型基于两个目标进行训练:

  1. 准确预测节点之间的连接:正确的连接是指那些将元训练数据中同类型的两个代表(例如,同一演员的两张照片)联系起来的边。
  2. 准确预测局部数据密度:对于每个节点,模型需要预测其附近邻居中属于同类型的比例。

通过单一模型联合预测连接和密度,显著提高了计算效率。同时,由于采用了分层处理方案,模型可以优化整个输入图的聚类效果,避免了先前方法中将图分割成子图再进行处理所带来的局限性。

实验与结果

在实验中,使用两组不同的元训练数据:一组是人类面部特写,另一组是特定动物物种的图像。用训练好的面部模型在两个与训练集类别重叠极低(0%和低于2%)的数据集上进行测试;用训练好的物种模型在一个包含未见过的物种的数据集上进行测试。结果显示,与之前的基于GNN的聚类模型和无监督聚类方法相比,该方法的F分数平均提升了49%和47%。

这项正在进行的研究,正在探索训练一个更通用的聚类模型的可能性,以使其推理性能能够更好地跨不同数据类型(例如同时精确聚类人脸和动物物种)迁移。

鸣谢:Tianjun Xiao, Yongxin Wang, Yuanjun Xiong, Wei Xia, David Wipf, Zhang Zheng, Stefano Soatto
更多精彩内容 请关注我的个人公众号 公众号(办公AI智能小助手)或者 我的个人博客 https://blog.qife122.com/
对网络安全、黑客技术感兴趣的朋友可以关注我的安全公众号(网络安全技术点滴分享)

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/15 14:49:37

Source Han Serif CN:企业级字体解决方案完整指南

Source Han Serif CN:企业级字体解决方案完整指南 【免费下载链接】source-han-serif-ttf Source Han Serif TTF 项目地址: https://gitcode.com/gh_mirrors/so/source-han-serif-ttf Source Han Serif CN作为业界领先的开源中文字体,凭借其完整的…

作者头像 李华
网站建设 2026/4/15 14:48:08

5步完成CPU性能优化:CoreCycler终极调校指南

5步完成CPU性能优化:CoreCycler终极调校指南 【免费下载链接】corecycler Stability test script for PBO & Curve Optimizer stability testing on AMD Ryzen processors 项目地址: https://gitcode.com/gh_mirrors/co/corecycler CoreCycler作为专业的…

作者头像 李华
网站建设 2026/4/15 16:27:54

YimMenu终极配置教程:免费GTA5游戏辅助工具完整使用手册

YimMenu终极配置教程:免费GTA5游戏辅助工具完整使用手册 【免费下载链接】YimMenu YimMenu, a GTA V menu protecting against a wide ranges of the public crashes and improving the overall experience. 项目地址: https://gitcode.com/GitHub_Trending/yi/Yi…

作者头像 李华
网站建设 2026/4/15 12:01:24

机械键盘防抖终极解决方案:告别按键连击困扰

机械键盘防抖终极解决方案:告别按键连击困扰 【免费下载链接】KeyboardChatterBlocker A handy quick tool for blocking mechanical keyboard chatter. 项目地址: https://gitcode.com/gh_mirrors/ke/KeyboardChatterBlocker 还在为机械键盘按键重复输入而烦…

作者头像 李华