Tensorflow模型建立与训练
Tensorflow快速搭建动态模型
模型的构建:tf.keras.Model和tf.keras.layers
模型的损失函数:tf.keras.losses
模型的优化器:tf.keras.optimizer
模型的评估:tf.keras.metrics
模型(Model)与层(Layer)
在tensorflow中,推荐使用keras(tf.keras)构建模型。
keras有两个重要的概念:模型(Model)和层(Layer)。层将各种计算流程和变量进行了封装(例如基本的全连接层,CNN的卷积层、池化层等),而模型则将各种层进行组织和连接,并封装成一个整体,描述了如何将输入数据通过各种层以及运算而得到输出。在需要模型调用的时候,使用y_pred=model(X),的形式即可。Keras在tf.keras.layers下内置了深度学习中大量常用的预定义层,同时也允许我们自定义层。
通过模型类的方式编写如下代码:
# y_pred = a*X +b
#y_pred = w1*X1 + w2*X2 + w3*X3 + b
import tensorflow as tf
X = tf.constant([[1.0, 2.0, 3.0], [4.0, 5.0, 6.0]])
y = tf.constant([[10.0], [20.0]])
class Linear(tf.keras.Model):
def __init__(self):
super().__init__()
# tf.keras.layers.Dense全连接层
self.dense = tf.keras.layers.Dense(
units=1,#一个神经元
activation=None,#没有**函数
kernel_initializer=tf.zeros_initializer(),#权重系统初始化为0,即 [w1,w2,w3]=[0,0,0]
bias_initializer=tf.zeros_initializer()#偏执b初始化维0,即bias =0
)
def call(self, input):
output = self.dense(input)#将输入的数据作为dense的输入参数
return output#返回经过dense模型计算之后的数据
# 以下代码结构与前节类似
model = Linear()
optimizer = tf.keras.optimizers.SGD(learning_rate=0.01) #如何对权重系数 & 偏执做梯度下降
for i in range(100): #100 epoch
with tf.GradientTape() as tape:
y_pred = model(X) # 调用模型 y_pred = model(X) 而不是显式写出 y_pred = a * X + b
loss = tf.reduce_mean(tf.square(y_pred - y))
grads = tape.gradient(loss, model.variables) # 使用 model.variables 这一属性直接获得模型中的所有变量,[w1,w2,w3,b]
optimizer.apply_gradients(grads_and_vars=zip(grads, model.variables))
print(model.variables)
输出:
[<tf.Variable 'linear_1/dense_1/kernel:0' shape=(3, 1) dtype=float32, numpy=
array([[0.40784496],
[1.191065 ],
[1.9742855 ]], dtype=float32)>, <tf.Variable 'linear_1/dense_1/bias:0' shape=(1,) dtype=float32, numpy=array([0.78322077], dtype=float32)>]
*****************************************************
tf.keras.layers.Dense(
inputs=64, # 输入该网络层的数据
units=10, # 输出的维度大小
activation=None, # 选择使用的(**函数)
use_bias=True, # 是否使用(偏置项)
kernel_initializer=None, # 卷积核的初始化器
bias_initializer=tf.zeros_initializer(), # 偏置项的初始化器
kernel_regularizer=None, # 卷积核的正则化
activaty_regularizer=None, # 偏置项的正则化
kernel_constraint=None, # 对主权重矩阵进行约束
bias_constraint=None, # 对偏置向量进行约束
trainable=True, # 可以设置为不可训练,(冻结)网络层
name=None, # 层的名字
reuse=None # 是否重复使用参数
)
*****************************************************