欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页

2018-08-06 建造我们的第一个神经网络

程序员文章站 2022-07-06 22:22:08
...

一、添加层add_layer

  在 Tensorflow 里定义一个添加层的函数可以很容易的添加神经层,为之后的添加省下不少时间。神经层里常见的参数通常有weights、biases和激励函数。
  定义添加神经层的函数def add_layer(),它有四个参数:输入值、输入的大小、输出的大小和激励函数,我们设定默认的激励函数是None。

def add_layer(inputs, in_size, out_size, activation_function=None):

  接下来是weights和biases。
  因为在生成初始参数时,随机变量(normal distribution)会比全部为0要好很多,所以我们这里的weights为一个in_size行, out_size列的随机变量矩阵。

Weights = tf.Variable(tf.random_normal([in_size, out_size]))

  在机器学习中,biases的推荐值不为0,所以我们这里是在0向量的基础上又加了0.1。

biases = tf.Variable(tf.zeros([1, out_size]) + 0.1)

  下面,我们定义xW_plus_b, 即神经网络未**的值。其中,tf.matmul()是矩阵的乘法。

xW_plus_b= tf.matmul(inputs, Weights) + biases

  当activation_function——激励函数为None时,输出就是当前的预测值——xW_plus_b,不为None时,就把Wx_plus_b传到activation_function()函数中得到输出。

if activation_function is None:
        outputs = xW_plus_b
    else:
        outputs = activation_function(xW_plus_b)

return outputs

参考链接:https://morvanzhou.github.io/tutorials/machine-learning/tensorflow/3-1-add-layer/

二、建造神经网络

  1. 导入数据
      这里的x_data和y_data并不是严格的一元二次函数的关系,因为我们多加了一个noise,这样看起来会更像真实情况。
x_data = np.linspace(-1,1,300, dtype=np.float32)[:, np.newaxis]
noise = np.random.normal(0, 0.05, x_data.shape).astype(np.float32)
y_data = np.square(x_data) - 0.5 + noise

  利用占位符定义我们所需的神经网络的输入。 tf.placeholder()就是代表占位符,这里的None代表无论输入有多少都可以,因为输入只有一个特征,所以这里是1。

xs = tf.placeholder(tf.float32, [None, 1])
ys = tf.placeholder(tf.float32, [None, 1])

  接下来就可以开始定义神经层了。 通常神经层都包括输入层、隐藏层和输出层。这里的输入层只有一个属性, 所以我们就只有一个输入;隐藏层我们可以自己假设,这里我们假设隐藏层有10个神经元; 输出层和输入层的结构是一样的,所以我们的输出层也是只有一层。 所以,我们构建的是——输入层1个、隐藏层10个、输出层1个的神经网络。
  利用之前的add_layer()函数定义隐藏层,这里使用 Tensorflow 自带的激励函数tf.nn.relu。

l1 = add_layer(xs, 1, 10, activation_function=tf.nn.relu)

  接着,定义输出层。此时的输入就是隐藏层的输出——l1,输入有10个神经元(隐藏层的输出层),输出有1个神经元。

prediction = add_layer(l1, 10, 1, activation_function=None)

  计算预测值prediction和真实值的误差,对二者差的平方取平均。

loss = tf.reduce_mean(tf.square(ys - prediction),
                     reduction_indices=[1])

  接下来,是很关键的一步,如何让机器学习提升它的准确率。tf.train.GradientDescentOptimizer()中的值通常都小于1,这里取的是0.1,代表以0.1的效率来最小化误差loss。

train_step = tf.train.GradientDescentOptimizer(0.1).minimize(loss)

  定义Session,并用 Session 来执行初始化步骤。 (注意:在tensorflow中,只有session.run()才会执行我们定义的运算。)

init = tf.global_variables_initializer()
sess = tf.Session()
sess.run(init)
for i in range(1000):
    # training
    sess.run(train_step, feed_dict={xs: x_data, ys: y_data})
    if i % 50 == 0:
        # to see the step improvement
        print(sess.run(loss, feed_dict={xs: x_data, ys: y_data}))

参考链接:https://morvanzhou.github.io/tutorials/machine-learning/tensorflow/3-2-create-NN/

三、结果可视化

  构建图形,用散点图描述真实数据之间的关系。 (注意:这里是直接在前面的基础上写的代码,需要from matplot import pyplot as plt,plt.ion()表示开启交互模式,用于连续显示。)

# plot the real data
fig = plt.figure()
ax = fig.add_subplot(1,1,1)
ax.scatter(x_data, y_data)
plt.ion() #本次运行请注释,全局运行不要注释
plt.show()

  接下来,我们来显示预测数据。每隔50次训练刷新一次图形,用红色、宽度为5的线来显示我们的预测数据和输入之间的关系,并暂停0.1s。

for i in range(1000):
    # training
    sess.run(train_step, feed_dict={xs: x_data, ys: y_data})
    if i % 50 == 0:
        # to visualize the result and improvement
        try:
            ax.lines.remove(lines[0])
        except Exception:
            pass
        prediction_value = sess.run(prediction, feed_dict={xs: x_data})
        # plot the prediction
        lines = ax.plot(x_data, prediction_value, 'r-', lw=5)
        plt.pause(0.1)

参考链接:https://morvanzhou.github.io/tutorials/machine-learning/tensorflow/3-3-visualize-result/

四、优化器

  Tensorflow 中的优化器会有很多不同的种类。最基本, 也是最常用的一种就是GradientDescentOptimizer。一般比较常用的是MomentumOptimizer和AdamOptimizer。另外,Alpha Go使用的优化器是RMSPropOptimizer。

 

2018-08-06 建造我们的第一个神经网络
标题https://www.tensorflow.org/versions/r0.11/api_docs/python/train.html

 

相关标签: tensorflow