当前位置：代码网 > 科技>人工智能>机器学习 > 多视角聚类论文笔记(二)Multi-level Feature Learning for Contrastive Multi-view Clustering（MFLVC）

多视角聚类论文笔记(二)Multi-level Feature Learning for Contrastive Multi-view Clustering（MFLVC）

2024年08月01日 • 机器学习 •我要评论

现有的MVC工作在同一个特征空间中惩罚多个目标，他们忽略了学习一致的公共语义和重建不一致的视图私有信息之间的冲突。本文以不融合的方式从原始特征中学习不同层次的特征，包括低级特征、高级特征和语义标签/特征，从而有效地实现不同特征空间的重建目标和一致性目标。具体来说，重建目标是在底层特征上进行的。基于对比学习的两个一致性目标分别在高级特征和语义标签上进行。它们使高级特征有效地挖掘公共语义，使语义标签实现多视图聚类。因此，所提出的框架可以减少视图私有信息的不利影响。

proceedings of the ieee computer society conference on computer vision and pattern recognition（cvpr-2022）

xu, jietang, huayiren, yazhoupeng, liangzhu, xiaofeng

一、解决问题

大多数mvc方法都试图通过融合所有视图的特征来发现潜在的聚类模式，然而，与共同语义相比，无意义的视图私有信息可能在特征融合过程中占主导地位，从而影响聚类的质量。
一些mvc方法利用潜在特征上的一致性目标来探索所有视图的公共语义。然而他们通常也需要在相同的潜在特征上执行重构目标以避免琐碎的解决方案，这就导致了一致性目标尽可能学习所有视图中具有共同语义的特征，而重构目标希望相同的特征维护单个视图的视图私有信息的冲突。

二、方法

主要思想

设计一个无融合的mvc模型，以避免在所有视图之间融合不利的视图私有信息；

为每个视图中的样本生成不同级别的特征，包括低级特征、高级特征和语义标签/特征；

模型图

可将模型划分为二个子模块：

特征分级模块

该模块的主要工作：

利用自编码器从原始特征中学习低级特征，然后让低级特征分别通过一个feature mlp 和一个label mlp，以获得高级特征h和语义标签q；其中每个mlp由所有视图共享，有助于过滤出视图的私有信息；

两个mlp的设计如下：

主要区别就是label mlp在线性层后加了softmax

重构损失函数：

多视角对比学习模块

该模块的主要工作：

通过对比执行一致性目标通过对比学习来实现：

在高级特征h在进行级对比，以挖掘所有视角视角的共同语义信息。h包含了所有视角的h，不同视角的同一样本（行）视为正样本，其余为负样本，损失函数如下：

距离度量函数：

最后再给所有视图的对比损失累加起来：

基于所有视图的相同聚类标签表示相同的语义聚类的理论（在视图间，q的不同列（簇）的分布应该一致），在语义标签q在进列级对比学习，以学习聚类一致性。q包含了所有视角的q，不同视角的同一簇（列）视为正样本，其余为负样本，损失函数如下：

损失函数：

损失函数第一项旨在学习所有视图的聚类一致性，第二项是正则化项，用于避免将所有样本分配到单个聚类中，且：

具有高级特征的语义聚类模块

该模块的主要工作：

将每个视图的聚类分配q作为锚点，与每个视图中的高级特征h的聚类进行最大化匹配，以利用高级特征中包含的聚类信息来提高语义标签的聚类效率。匹配操作应该类似于最大二分图匹配，这里我讲不清，就不讲了emmmm......

匹配结束后，就可以通过q获得最终的聚类结果：

三、损失函数与训练过程

看了论文代码，训练分为三阶段：

编码器的预训练（200epochs）:l_z
在h和q上的对比学习训练（50epochs） :l_h+l_q+l_z
微调阶段（50epochs）:l_p

四、实验结果

五、收获

通过对低维特征空间的分层次映射，可以实现无融合聚类；
避免在同一特征空间上进行重构和执行一致性目标；
对比学习方式：行级对比和列级对比

赞 (0)

相关文章:

[自然语言处理] 自然语言处理库spaCy使用指北

自然语言处理（Natural Language Processing，简称NLP）是一门研究人类语言与计算机之间交互的领域，旨在使计算机能够理解、解析、生成和处理人类语言。NLP结…

2024年08月01日 • 人工智能
人工智能-算法篇47篇-自然语言处理之特征提取学习

自然语言处理是人工智能领域中的一个重要分支，旨在使计算机能够理解、处理和生成自然语言。自然语言处理涉及多个任务，包括但不限于文本分类、情感分析、命名实体识别、关... [阅读全文]
NLP的发展阶段

自然语言处理（Natural Language Process，简称NLP）是计算机科学与自然语言交互的一门学科，主要目的是使计算机能够理解自然语言处理以便能够... [阅读全文]
【科学文献计量】利用pybibx分析Scopus文献数据集（EDA,N-Grams,Cluster,Network analysis,NLP）

文章介绍了利用pybibx库对scopus文献数据，进行探索式分析EDA，N-Grams语言模型构建及可视化，文献聚类和映射，网络分析（社区网络分析、个人网络分... [阅读全文]
NLP自然语言处理——关键词提取之 TF-IDF 算法（五分钟带你深刻领悟TF-IDF算法的精髓）

新手入门保姆级教程!!!自然语言文本预处理、TF-IDF算法详解（三个维度：原理、流程图、代码）、好玩的中文关键词“词云生成”（解决乱码问题）# 获取停用词# 加载文档集，对文档集…

2024年08月01日 • 人工智能
【新手入门】NLP机器翻译（3）——基于Transformer的翻译模型

它们是用于计算和思考注意力的抽象概念。一旦你继续阅读下面的注意力是如何计算的，你就会知道你需要知道的关于这些向量中的每一个所扮演的角色的所有信息。…

2024年08月01日 • 人工智能

版权声明：本文内容由互联网用户贡献，该文观点仅代表作者本人。本站仅提供信息存储服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，请发送邮件至 2386932994@qq.com 举报，一经查实将立刻删除。

发表评论


验证码：

Copyright © 2017-2026 代码网保留所有权利. 粤ICP备2024248653号
站长QQ:2386932994 | 联系邮箱：2386932994@qq.com