TensorFlow的自动求导原理分析

程序员文章站 2022-06-27 09:28:52

原理：tensorflow使用的求导方法称为自动微分（automatic differentiation），它既不是符号求导也不是数值求导，而类似于将两者结合的产物。最基本的原理就是链式法则，关键思想...

原理：

tensorflow使用的求导方法称为自动微分（automatic differentiation），它既不是符号求导也不是数值求导，而类似于将两者结合的产物。

最基本的原理就是链式法则，关键思想是在基本操作（op）的水平上应用符号求导，并保持中间结果（grad）。

基本操作的符号求导定义在\tensorflow\python\ops\math_grad.py文件中，这个文件中的所有函数都用registergradient装饰器包装了起来，这些函数都接受两个参数op和grad，参数op是操作，第二个参数是grad是之前的梯度。

链式求导代码：

TensorFlow的自动求导原理分析

举个例子：

TensorFlow的自动求导原理分析

补充：聊聊tensorflow自动求导机制

自动求导机制

在即时执行模式下，tensorflow引入tf.gradienttape()这个“求导记录器”来实现自动求导。

计算函数y(x)=x^2在x = 3时的导数：

import tensorflow as tf
#定义变量
x = tf.variable(initial_value = 3.)

#在tf.gradienttape()的上下文内，所有计算步骤都会被记录以用于求导
with tf.gradienttape() as tape:
    #y = x^2
    y = tf.square(x)
#计算y关于x的导数(斜率，梯度)
y_grad = tape.gradient(y,x)
print([y,y_grad])

输出：

[<tf.tensor: shape=(), dtype=float32, numpy=9.0>, <tf.tensor: shape=(), dtype=float32, numpy=6.0>]

以上为个人经验，希望能给大家一个参考，也希望大家多多支持。

TensorFlow的自动求导原理分析

原理：

链式求导代码：

自动求导机制

计算函数y(x)=x^2在x = 3时的导数：

详解Java线程池和Executor原理的分析

深入分析java并发编程中volatile的实现原理

TCP/IP协议中三次握手四次挥手的原理及流程分析

利用脚本自动安装SQLServer的实现步骤分析

Java序列化机制与原理的深入分析

SQL语句的执行原理分析

MYSQL自动备份策略的选择与优劣点分析

利用脚本自动安装SQLServer的实现步骤分析

百度工程师讲PHP函数的实现原理及性能分析（二）

百度工程师讲PHP函数的实现原理及性能分析（一）