当前位置: 代码网 > 科技>人工智能>机器学习 > 多视角聚类论文笔记(二)Multi-level Feature Learning for Contrastive Multi-view Clustering(MFLVC)

多视角聚类论文笔记(二)Multi-level Feature Learning for Contrastive Multi-view Clustering(MFLVC)

2024年08月01日 机器学习 我要评论
现有的MVC工作在同一个特征空间中惩罚多个目标,他们忽略了学习一致的公共语义和重建不一致的视图私有信息之间的冲突。本文以不融合的方式从原始特征中学习不同层次的特征,包括低级特征、高级特征和语义标签/特征,从而有效地实现不同特征空间的重建目标和一致性目标。具体来说,重建目标是在底层特征上进行的。基于对比学习的两个一致性目标分别在高级特征和语义标签上进行。它们使高级特征有效地挖掘公共语义,使语义标签实现多视图聚类。因此,所提出的框架可以减少视图私有信息的不利影响。

proceedings of the ieee computer society conference on computer vision and pattern recognition(cvpr-2022)

xu, jietang, huayiren, yazhoupeng, liangzhu, xiaofeng


一、解决问题

  1. 大多数mvc方法都试图通过融合所有视图的特征来发现潜在的聚类模式,然而,与共同语义相比,无意义的视图私有信息可能在特征融合过程中占主导地位,从而影响聚类的质量。
  2. 一些mvc方法利用潜在特征上的一致性目标来探索所有视图的公共语义。然而他们通常也需要在相同的潜在特征上执行重构目标以避免琐碎的解决方案,这就导致了一致性目标尽可能学习所有视图中具有共同语义的特征,而重构目标希望相同的特征维护单个视图的视图私有信息的冲突。

二、方法

  • 主要思想

        设计一个无融合的mvc模型,以避免在所有视图之间融合不利的视图私有信息;

        为每个视图中的样本生成不同级别的特征,包括低级特征、高级特征和语义标签/特征;

  • 模型图

可将模型划分为二个子模块:

  • 特征分级模块

  •  该模块的主要工作:

        利用自编码器从原始特征中学习低级特征,然后让低级特征分别通过一个feature mlp 和一个label mlp,以获得高级特征h和语义标签q;其中每个mlp由所有视图共享,有助于过滤出视图的私有信息;

两个mlp的设计如下:

        主要区别就是label mlp在线性层后加了softmax

        重构损失函数:

  • 多视角对比学习模块

  •  该模块的主要工作: 

        通过对比执行一致性目标通过对比学习来实现:

        在高级特征h在进行级对比,以挖掘所有视角视角的共同语义信息。h包含了所有视角的h,不同视角的同一样本(行)视为正样本,其余为负样本,损失函数如下:

         距离度量函数:

         最后再给所有视图的对比损失累加起来:

       基于所有视图的相同聚类标签表示相同的语义聚类的理论(在视图间,q的不同列(簇)的分布应该一致),在语义标签q在进列级对比学习,以学习聚类一致性。q包含了所有视角的q,不同视角的同一簇(列)视为正样本,其余为负样本,损失函数如下: 

         损失函数:

        损失函数第一项旨在学习所有视图的聚类一致性,第二项是正则化项,用于避免将所有样本分配到单个聚类中,且:

  • 具有高级特征的语义聚类模块 

  •   该模块的主要工作: 

        将每个视图的聚类分配q作为锚点,与每个视图中的高级特征h的聚类进行最大化匹配,以利用高级特征中包含的聚类信息来提高语义标签的聚类效率。匹配操作应该类似于最大二分图匹配,这里我讲不清,就不讲了emmmm......

         匹配结束后,就可以通过q获得最终的聚类结果:

 三、损失函数与训练过程

看了论文代码,训练分为三阶段:

  • 编码器的预训练(200epochs):l_z 
  • 在h和q上的对比学习训练(50epochs) :l_h+l_q+l_z
  • 微调阶段(50epochs):l_p

四、实验结果

五、收获

  1. 通过对低维特征空间的分层次映射,可以实现无融合聚类;
  2. 避免在同一特征空间上进行重构和执行一致性目标;
  3. 对比学习方式:行级对比和列级对比

 

 

(0)

相关文章:

版权声明:本文内容由互联网用户贡献,该文观点仅代表作者本人。本站仅提供信息存储服务,不拥有所有权,不承担相关法律责任。 如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 2386932994@qq.com 举报,一经查实将立刻删除。

发表评论

验证码:
Copyright © 2017-2025  代码网 保留所有权利. 粤ICP备2024248653号
站长QQ:2386932994 | 联系邮箱:2386932994@qq.com