机器学习笔记之EM算法(三)隐变量与EM算法的本质_机器学习

机器学习笔记之em算法——隐变量与em算法的本质

引言

引言

介绍了em算法公式的导出过程，本节将重新回顾em算法，比对各模型的求解方式，并探究引入隐变量与em算法的本质。

回顾：em算法

从性质上介绍em算法

em算法本质上是一种算法，它的目标是通过求解参数 $\theta$ ，将概率模型 $p(\mathcal x \mid \theta)$ 表示出来。
和em算法具有 相似性质 的如：极大似然估计(mle)，最大后验概率估计(map)：
$\hat \theta_{mle} = \mathop{\arg\max}\limits_{\theta} \log p(\mathcal x \mid \theta) \\ \hat \theta_{map} \propto \mathop{\arg\max}\limits_{\theta} \log p(\mathcal x \mid \theta)p(\theta)$

和上述两种方法不同的是，em算法并没有求解析解，而是迭代解：
与其说是求解，不如说是对求解过程中‘对解进行优化’。相似方法的有‘梯度下降’~
$\theta^{(t+1)} = \mathop{\arg\max}\limits_{\theta} \int_{\mathcal z} p(\mathcal x,\mathcal z \mid \theta)p(\mathcal z \mid \mathcal x,\theta^{(t)}) d\mathcal z$
通过em算法的收敛性证明，可以推导出em算法在迭代过程中可以对模型参数的解 $\theta$ 进行优化，从而达到一个至少是局部最优的解：
$\log p(\mathcal x \mid \theta^{(t+1)}) \geq \log p(\mathcal x \mid \theta^{(t)})$

其他概念回顾

由于em算法的算法性质，自然和之前介绍的其他概念存在明显区分：

线性回归

例如之前介绍的很多概念如：线性回归，它的模型只是一个线性函数：
$f(\mathcal w,b) = \mathcal w^{t}\mathcal x + b$
基于该模型，如何通过求解模型参数 $\mathcal w,b$ 来实现回归任务？因此介绍一种求解模型参数 $\mathcal w,b$ 的工具：最小二乘估计：
$\mathcal l(\mathcal w,b) = \sum_{i=1}^n||\mathcal w^{t}x^{(i)} + b - y^{(i)}|| \quad (x^{(i)},y^{(i)}) \in data$

决策树-电信用户流失预测

首先，我们需要导入所需的库，并加载数据集。数据集包含多个特征，如客户年龄、性别、收入等，以及一个目标变量“流失状态”。接下来，我们将数据集划分为训练集和测试集。... [阅读全文]


验证码：

验证码：

机器学习笔记之EM算法(三)隐变量与EM算法的本质

2024年08月01日 • 机器学习 •我要评论

机器学习笔记之em算法——隐变量与em算法的本质

引言

回顾：em算法

从性质上介绍em算法

其他概念回顾

线性回归

相关文章:

机器学习（五） -- 监督学习（3） -- 决策树

【模型】5分钟了解决策树是一个什么模型

机器学习入门教学——决策树

机器学习--决策树（ID3，C4.5，CART）的原理

决策树的分类

发表评论