每天五分钟机器学习:聚类算法中经常使用的肘部法则是什么?
如何选择聚类的数目K,也就是说我们要将数据聚成几簇。我们可以通过可视化的方式(画图),或者聚类算法的输出结果(试一试)来手动的决定聚类的数目,或者根据实际需要来确定我们想要聚成几簇,比如前面的衣服问题。对于肘部法则,我们所需要做的是改变 k 值,也就是聚类类别的数量。我们对不同的k来计算代价函数,我们可以会得到这样的一条曲线: 这条曲线我们可以清楚的看到有一个肘点,所以我们选择K=3(因为K=3之后损失降低的慢了),但是有些时候可能我们得到的曲线是这样的: 这个没有明确的肘点,而是相对比较光滑的,所以这样的
本文重点
如何选择聚类的数目k,也就是说我们要将数据聚成几簇。我们可以通过可视化的方式(画图),或者聚类算法的输出结果(试一试)来手动的决定聚类的数目,或者根据实际需要来确定我们想要聚成几簇,比如前面的衣服问题。
肘部法则
对于肘部法则,我们所需要做的是改变 k 值,也就是聚类类别的数量。我们对不同的k来计算代价函数,我们可以会得到这样的一条曲线:

这条曲线我们可以清楚的看到有一个肘点,所以我们选择k=3(因为k=3之后损失降低的慢了),但是有些时候可能我们得到的曲线是这样的:

这个没有明确的肘点,而是相对比较光滑的,所以这样的话,我们的肘部法则就没有办法使用了。所以肘部法则不能保证所有情况都能有用。
相关文章:
-
自然语言处理(Natural Language Processing,简称NLP)是一门研究人类语言与计算机之间交互的领域,旨在使计算机能够理解、解析、生成和处理人类语言。NLP结…
-
-
NLP的发展阶段
自然语言处理(Natural Language Process,简称NLP)是计算机科学与自然语言交互的一门学科,主要目的是使计算机能够理解自然语言处理以便能够...
[阅读全文]
-
-
新手入门保姆级教程!!!自然语言文本预处理、TF-IDF算法详解(三个维度:原理、流程图、代码)、好玩的中文关键词“词云生成”(解决乱码问题)# 获取停用词# 加载文档集,对文档集…
-
它们是用于计算和思考注意力的抽象概念。一旦你继续阅读下面的注意力是如何计算的,你就会知道你需要知道的关于这些向量中的每一个所扮演的角色的所有信息。…
版权声明:本文内容由互联网用户贡献,该文观点仅代表作者本人。本站仅提供信息存储服务,不拥有所有权,不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 2386932994@qq.com 举报,一经查实将立刻删除。
发表评论