【AI底层逻辑】——篇章5(下):机器学习算法之聚类&降维&时间序列
2024年08月03日
•
算法
•
我要评论
时间序列模型在解决实际问题时,序列必须满足特定的数据分布,或者具有平稳的时间序列特性,比如在剔除趋势数据后,时间序列不能与时间有依赖关系,数据波动的频率和幅度不能随时间变化等。——举例来说,随意挑选两个特征构建它们的散点图,如下图所示,图中每个点有两个特征,分别对应X轴和Y轴,在图中画一条直线,将所有点投影到这条线上就可以构建出一个新的特征(新的X轴)——它可以。,不存在普遍适用的最优算法。,如果变量之间存在关联,那么使用更少的综合变量来代替原变量,减少数据维度,理论上可行的——
续上:
目录
4、聚类
5、降维
6、时间序列
三、无完美算法
往期精彩:
4、聚类
聚类即把相似的东西归在一起,与分类不同的是,聚类要处理的是没有标签的数据集,它根据样本数据的分布特性自动进行归类。
人在认知是事物时倾向于简化,虽然世界上不存在完全相同的个体,但是却不影响对它们进行归类,大脑用抽取共性的方式使得我们快速记忆不同的事物。
聚类是典型的无监督学习算法,基本思路都是利用每个数据样本所表示的向量之间的“距离”或密集程度来进行归类。这与分类算法中的k邻近算法思路相近。典型的“计算距离”的聚类算法有k均值(k-means)算法,具体步骤如下:
1、任意取k个数据点作为初始中心;
2、依次计算其他点到这些中心的距离;
3、将每个点归类到与它距离最近的中心,每个类别下点下的集合是一个类簇;
4、重新计算各类簇的中心位置(即类簇中所有点的中心——质心;
5、重复上述2、3、4步骤,直到所有数据点都被归类,且类簇的中心位置没有明显变化;
此时可认为聚类任务完成,其基本思路就是不断拉拢身边距离相近的样本数据,将它们归为同类。
相关文章:
-
通过本文可以了解到1.什么是图像的距离?2.什么是距离变换?3.距离变换的计算4.OpenCV中距离变换的实现距离(distance)是描述图像两点像素之间的远近关系的度量,常见的…
-
在OpenCV中,开运算(Opening)和闭运算(Closing)都是图像形态学的操作,它们经常与腐蚀和膨胀操作结合使用,用于图像处理和分析中的一些任务,如去噪、平滑、边缘检测等…
-
-
YOLOv5 作为 YOLO 家族的第五个版本,本身也演进了几个子版本,现在网上的资料都没有标注具体是哪个子版本的,导致不同文章之间各种混乱,像是盲人摸象。其实官方的里对各个版本的…
-
-
雷达技术在军事、航空、气象等领域扮演着至关重要的角色,而在雷达信号处理中,恒虚警率(CFAR)算法被视为一种重要的工具,用于检测信号中的目标并过滤掉噪声。本文将带领读者深入探讨CF…
版权声明:本文内容由互联网用户贡献,该文观点仅代表作者本人。本站仅提供信息存储服务,不拥有所有权,不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 2386932994@qq.com 举报,一经查实将立刻删除。
发表评论