PyTorch 激活函数的实现示例_Python

激活函数是神经网络中至关重要的组成部分，它们为网络引入了非线性特性，使得神经网络能够学习复杂模式。pytorch 提供了多种常用的激活函数实现。

常用激活函数

1. relu (rectified linear unit)

数学表达式:

pytorch实现:

torch.nn.relu(inplace=false)

特点:

计算简单高效
解决梯度消失问题（正区间）
可能导致"神经元死亡"（负区间梯度为0），relu 在输入为负时输出恒为 0，导致反向传播中梯度消失，相关权重无法更新‌14。若神经元长期处于负输入状态，则会永久“死亡”，失去学习能力‌。

示例:

relu = nn.relu()
input = torch.tensor([-1.0, 0.0, 1.0, 2.0])
output = relu(input)  # tensor([0., 0., 1., 2.])

2. leakyrelu

数学表达式:

pytorch实现:

torch.nn.leakyrelu(negative_slope=0.01, inplace=false)

特点:

解决了relu的"神经元死亡"问题，通过引入负区间的微小斜率（如 torch.nn.leakyrelu(negative_slope=0.01)），保留负输入的梯度传播，避免神经元死亡‌。
negative_slope通常设为0.01

示例

leaky_relu = nn.leakyrelu(negative_slope=0.1)
input = torch.tensor([-1.0, 0.0, 1.0, 2.0])
output = leaky_relu(input)  # tensor([-0.1000, 0.0000, 1.0000, 2.0000])

3. sigmoid

数学表达式:

pytorch实现:

torch.nn.sigmoid()

特点:

输出范围(0,1)，适合二分类问题
容易出现梯度消失问题
输出不以0为中心

示例:

sigmoid = nn.sigmoid()
input = torch.tensor([-1.0, 0.0, 1.0, 2.0])
output = sigmoid(input)  # tensor([0.2689, 0.5000, 0.7311, 0.8808])

4. tanh (hyperbolic tangent)

数学表达式:

pytorch实现:

torch.nn.tanh()

特点:

输出范围(-1,1)，以0为中心
比sigmoid梯度更强
仍存在梯度消失问题

示例:

tanh = nn.tanh()
input = torch.tensor([-1.0, 0.0, 1.0, 2.0])
output = tanh(input)  # tensor([-0.7616, 0.0000, 0.7616, 0.9640])

5. softmax

数学表达式:

pytorch实现:

torch.nn.softmax(dim=none)

特点:

输出为概率分布（和为1）
常用于多分类问题的输出层
dim参数指定计算维度

示例:

softmax = nn.softmax(dim=1)
input = torch.tensor([[1.0, 2.0, 3.0]])
output = softmax(input)  # tensor([[0.0900, 0.2447, 0.6652]])

其他激活函数

6. elu (exponential linear unit)

torch.nn.elu(alpha=1.0, inplace=false)

7. gelu (gaussian error linear unit)

torch.nn.gelu()

8. swish

class swish(nn.module):
    def forward(self, x):
        return x * torch.sigmoid(x)

选择指南

隐藏层：通常首选relu及其变体（leakyrelu、elu等）
二分类输出层：sigmoid
多分类输出层：softmax
需要负输出的情况：tanh或leakyrelu
transformer模型：常用gelu

自定义激活函数

pytorch可以轻松实现自定义激活函数：

class customactivation(nn.module):
    def __init__(self):
        super().__init__()
    
    def forward(self, x):
        return torch.where(x > 0, x, torch.exp(x) - 1)

注意事项

梯度消失/爆炸问题
死亡神经元问题（特别是relu）
计算效率考虑
初始化方法应与激活函数匹配

Django 表单验证Form的使用小结

概述在 django 表单处理中，数据验证是确保应用程序安全性和数据完整性的关键环节。cleaned_data、clean() 和 clean_xxx() 方法... [阅读全文]

python迭代器和生成器的区别解析

1.迭代器1.1 可迭代对象可迭代对象指的是实现了__iter__方法的对象，可以被for循环遍历的容器，比如一个列表，自定义的链表等。使用 iter... [阅读全文]

Python streamlit库快速构建交互式Web应用

在数据分析和机器学习项目中，如何将复杂的分析结果以简单直观的方式展示给用户是一项重要的挑战。streamlit 是一个专为数据科学家和机器学习工程师设计的pyt... [阅读全文]

Python结合wxPython打造一个优雅的图片预览工具

前言在日常工作中，我们经常需要快速预览图片文件或剪贴板中的图片。虽然操作系统自带的图片查看器可以完成基本功能，但如果能用浏览器来预览图片，不仅可以获得更好的缩放... [阅读全文]

Python轻松将PDF变成Word的完美解决方案

在数字化时代，pdf（便携式文档格式）因其跨平台共享和阅读的便利性而广泛使用。然而，在需要对文档进行编辑或修改时，将 pdf 转换为 word 变得尤为重要。本... [阅读全文]

Python异步编程入门协程到底是什么与线程、进程的区别

python异步编程入门：协程到底是什么？你可能已经遇到过这样的场景：写了一个爬虫，但请求网页时总是卡住；或者搭了个web服务，同时处理几个请求就变得慢吞吞。这... [阅读全文]


验证码：

验证码：

PyTorch 激活函数的实现示例

2025年12月24日 • Python •我要评论

常用激活函数

1. relu (rectified linear unit)

2. leakyrelu

3. sigmoid

4. tanh (hyperbolic tangent)

5. softmax

其他激活函数

6. elu (exponential linear unit)

7. gelu (gaussian error linear unit)

8. swish

选择指南

自定义激活函数

注意事项

相关文章:

发表评论