pytorch如何自定义forward和backward函数_Python

pytorch自定义forward和backward函数

pytorch会自动求导，但是当遇到无法自动求导的时候，需要自己认为定义求导过程，这个时候就涉及到要定义自己的forward和backward函数。

举例如下：

看到这里，大家应该会有很多疑问

比如：

1：ctx.save_for_backward和ctx.saved_tensors的含义
2：backward中各个计算函数的意义，以及backward的输入参数grad_out是什么，以及grad_out包含哪些数据。

针对以上问题，我们一个个解答

第一个问题：百度吧，答案很多！！！！
第二个问题：拿上面这个例子来看，我们定义了一个类似于线性层的东西，但注意这不是线性层，因为我们是直接把输入和weight用*来做点对点的乘法的，所以这不是我们通常情况下的线性层。

但是这么看也费劲，我们写一个网络，把这个函数加到网络中去，再完整的跑一遍看吧！

测试代码

结果如下：

来进行解答

首先，backward函数的返回值，就是对应着forward里面的参数的梯度，也就是说，forward函数里面有几个输入参数，那么backward函数的输出就要有几个！为什么是这样？

我们首先要理解backward的输入grad_out，为什么backward的参数就是一个，因为这是根据链式法则来的

比如，我们定义三个函数h（对应上面网络中linear1）,f（自定义函数xjm_inter）,d(对应上面网络中linear2),定义一个输入x(对应上面输入a)，定义一个输出y(对应上面输出b)：

y = d(f(h(x)))

现在，我们求y对x的偏导，那么：

dy/dx = dy/dd * dd/df * df/dh * dh/dx

好吧看到这里你可能还是不懂，为什么backward的参数就是一个grad_out！！

我们韩式以上面则个函数为例子，但是，我们现在不求y对x的导数，我们假设f函数有一个叶子节点（或者说requires_grad=true）的参数w1，现在我们要求y对w1的导数：

所以

dy/dw1 = dy/dd *dd/df * df/dw1

那么此时，f就是我们上面代码中自定义的xjm_inter函数，则 grad_out = dy/dd *dd/df。

怎么理解呢，根据链式法则，我们呢所定义的网络中的每一层都是一个单独的函数，所以函数中的变量的最终求导其实只取决于该函数本身，链式法则求导传递过来的其实永远都知识一个值，这就是为什么backward函数的输出只有一个。

扩展

当forward的输出有多个的时候，那么就有多个链式法则，因为可以同时对x或者对w求导，此时backward的输入可以是一个，也可以是对应forward输出的个数，如果是一个则是一个元组，包含对应的梯度！！！

那么我们的backward要实现什么样的功能呢？说到这里，大家应该大概能明白了，就是实现当前层那的梯度计算，并进行返回，所以，这也是为什么backward的返回值要和forward的输入值一一对应，否则会报错。

总结

以上为个人经验，希望能给大家一个参考，也希望大家多多支持代码网。

在Python中计算移动平均值的方法

前言在这篇文章中，我们将看到如何在python中计算移动平均值。移动平均是指总观测值集合中固定大小子集的一系列平均值。它也被称为滚动平均。考虑n个观测值的集合，k是用于确定任何时间…

2024年11月03日 • 前端脚本

Python 使用 Redis 作为缓存的操作方法

python 如何使用 redis 作为缓存一、引言在现代 web 应用程序和数据密集型服务中，性能和响应速度是至关重要的因素。而当应用需要频繁访问相同的... [阅读全文]

Python 实现Excel XLS和XLSX格式相互转换问题

在日常工作中，我们经常需要处理和转换不同格式的excel文件，以适应不同的需求和软件兼容性。excel文件的两种常见格式是xls（excel 97-2003）和... [阅读全文]

Python 处理数据库事务的操作方法

python 如何处理数据库事务数据库事务是指一组操作要么全部执行成功，要么全部回滚的过程。事务是确保数据库一致性的重要手段，特别是在处理需要多步操作的场景时，... [阅读全文]

pytest参数化:@pytest.mark.parametrize详解

pytest参数化:@pytest.mark.parametrize内置的pytest.mark.parametrize装饰器可以用来对测试函数进行参数化处理。... [阅读全文]

Python Flask 和 Django 的区别与适用场景示例分析

flask 和 django 的异同（结合代码解释）flask 和 django 是两个流行的 python web 框架。尽管它们都是用于构建 web 应用程... [阅读全文]


验证码：

验证码：

pytorch如何自定义forward和backward函数

2024年11月03日 • Python •我要评论