【人工智能】深度学习：神经网络模型_C/C++

公式表示为： ht=f(wihxt+whhht−1+bh)h_t = f(w_{ih}x_t + w_{hh}h_{t-1} + b_h)ht=f(wihxt+whhht−1+bh) yt=g(whoht+bo)y_t = g(w_{ho}h_t + b_o)yt=g(whoht+bo) 其中，fff是隐藏层的激活函数，ggg是输出层的激活函数，www和bbb分别是权重和偏置项。

lstm（长短期记忆网络）模型

lstm是一种改进的rnn，能够有效解决长期依赖问题。其通过引入记忆单元和门控机制，控制信息的保留和遗忘。

lstm结构

lstm的基本结构包括：

遗忘门（forget gate）：决定是否丢弃上一时间步的记忆
输入门（input gate）：决定是否接受当前时间步的输入
记忆单元（memory cell）：保留重要信息
输出门（output gate）：决定输出哪些信息

公式表示为： ft=σ(wf⋅[ht−1,xt]+bf)f_t = \sigma(w_f \cdot [h_{t-1}, x_t] + b_f)ft=σ(wf⋅[ht−1,xt]+bf) it=σ(wi⋅[ht−1,xt]+bi)i_t = \sigma(w_i \cdot [h_{t-1}, x_t] + b_i)it=σ(wi⋅[ht−1,xt]+bi) c~t=tanh⁡(wc⋅[ht−1,xt]+bc)\tilde{c}_t = \tanh(w_c \cdot [h_{t-1}, x_t] + b_c)c~t=tanh(wc⋅[ht−1,xt]+bc) ct=ft⋅ct−1+it⋅c~tc_t = f_t \cdot c_{t-1} + i_t \cdot \tilde{c}_tct=ft⋅ct−1+it⋅c~t ot=σ(wo⋅[ht−1,xt]+bo)o_t = \sigma(w_o \cdot [h_{t-1}, x_t] + b_o)ot=σ(wo⋅[ht−1,xt]+bo) ht=ot⋅tanh⁡(ct)h_t = o_t \cdot \tanh(c_t)ht=ot⋅tanh(ct)

gru模型

gru（gated recurrent unit）是一种简化的lstm模型，减少了计算复杂度，保留了lstm的长短期记忆能力。

gru结构

gru的基本结构包括：

重置门（reset gate）：控制如何合并新输入和前一个时间步的记忆
更新门（update gate）：控制如何更新当前时间步的状态

公式表示为： rt=σ(wr⋅[ht−1,xt]+br)r_t = \sigma(w_r \cdot [h_{t-1}, x_t] + b_r)rt=σ(wr⋅[ht−1,xt]+br) zt=σ(wz⋅[ht−1,xt]+bz)z_t = \sigma(w_z \cdot [h_{t-1}, x_t] + b_z)zt=σ(wz⋅[ht−1,xt]+bz) h~t=tanh⁡(wh⋅[rt⋅ht−1,xt]+bh)\tilde{h}_t = \tanh(w_h \cdot [r_t \cdot h_{t-1}, x_t] + b_h)h~t=tanh(wh⋅[rt⋅ht−1,xt]+bh) ht=(1−zt)⋅ht−1+zt⋅h~th_t = (1 - z_t) \cdot h_{t-1} + z_t \cdot \tilde{h}_tht=(1−zt)⋅ht−1+zt⋅h~t

计算重置门rtr_trt和候选状态h~t\tilde{h}_th~t

重置门rtr_trt控制前一个时间步的隐藏状态如何影响当前时间步的候选状态： rt=σ(wr⋅[ht−1,xt]+br)r_t = \sigma(w_r \cdot [h_{t-1}, x_t] + b_r)rt=σ(wr⋅[ht−1,xt]+br) 候选状态h~t\tilde{h}_th~t是当前时间步的潜在新信息： h~t=tanh⁡(wh⋅[rt⋅ht−1,xt]+bh)\tilde{h}_t = \tanh(w_h \cdot [r_t \cdot h_{t-1}, x_t] + b_h)h~t=tanh(wh⋅[rt⋅ht−1,xt]+bh)

计算更新门ztz_tzt和当前状态hth_tht

更新门ztz_tzt决定当前时间步的隐藏状态如何更新： zt=σ(wz⋅[ht−1,xt]+bz)z_t = \sigma(w_z \cdot [h_{t-1}, x_t] + b_z)zt=σ(wz⋅[ht−1,xt]+bz) 当前时间步的隐藏状态hth_tht通过前一个隐藏状态和当前候选状态的加权和计算： ht=(1−zt)⋅ht−1+zt⋅h~th_t = (1 - z_t) \cdot h_{t-1} + z_t \cdot \tilde{h}_tht=(1−zt)⋅ht−1+zt⋅h~t

这些模型和概念构成了神经网络在图像识别、自然语言处理等领域的基础和核心技术。

🎈众口难调🎈从心就好

【人工智能】深度学习：神经网络模型

2024年07月28日 • C/C++ •我要评论

神经网络基础知识

bp神经网络的概念

单个神经元的结构

cnn模型汇总

lenet5 模型

alexnet 模型

vgg模型

inception net（googlenet）模型

resnet （残差网络）

rnn模型（循环神经网络）

为什么需要rnn

rnn结构

lstm（长短期记忆网络）模型

lstm结构

gru模型

gru结构

计算重置门rtr_trt和候选状态h~t\tilde{h}_th~t

计算更新门ztz_tzt和当前状态hth_tht

相关文章:

【空间转录组】MIA分析

时序图聚类关联算法

【宠粉赠书】科研绘图神器：MATLAB科技绘图与数据分析

多维数据分析

发表评论


验证码：

【人工智能】深度学习：神经网络模型

2024年07月28日 • C/C++ •我要评论

神经网络基础知识

bp神经网络的概念

单个神经元的结构

cnn模型汇总

lenet5 模型

alexnet 模型

vgg模型

inception net（googlenet）模型

resnet （残差网络）

rnn模型（循环神经网络）

为什么需要rnn

rnn结构

lstm（长短期记忆网络）模型

lstm结构

gru模型

gru结构

计算重置门rtr_trt​和候选状态h~t\tilde{h}_th~t​

计算更新门ztz_tzt​和当前状态hth_tht​

相关文章:

【空间转录组】MIA分析

时序图聚类关联算法

【宠粉赠书】科研绘图神器：MATLAB科技绘图与数据分析

多维数据分析

发表评论

计算重置门rtr_trt和候选状态h~t\tilde{h}_th~t

计算更新门ztz_tzt和当前状态hth_tht