python神经网络TensorFlow简介常用基本操作教程
要将深度学习更快且更便捷地应用于新的问题中,选择一款深度学习工具是必不可少的步骤。
tensorflow是谷歌于2015年11月9日正式开源的计算框架。tensorflow计算框架可以很好地支持深度学习的各种算法。
tensorflow很好地兼容了学术研究和工业生产的不同需求。
一方面,tensorflow的灵活性使得研究人员能够利用它快速实现新的模型设计;
另一方面,tensorflow强大的分布式支持,对工业界在海量数据集上进行的模型训练也至关重要。作为谷歌开源的深度学习框架,tensorflow包含了谷歌过去10年间对于人工智能的探索和成功的商业应用。
除了tensorflow,目前还有一些主流的深度学习开源工具可以使用。每个工具都有着各自的特点,可以根据自己的需求和喜好选择适合自己的深度学习工具。比如我一开始学习深度学习的时候接触的是caffe,然后tensorflow开源之后了解到了tensorflow的一些特性,感觉还是更喜欢tensorflow的风格,当然也考虑到会使用一种以上的深度学习工具也算见不错的事情。
其它一些主流的深度学习工具有:
caffe: http://caffe.berkeleyvision.org/(convolutional architecture for fast feature embedding) bvlc
mxnet: http://mxnet.readthedocs.io/en/latest/ (百度 dmlc(分布式机器学习社区) 简称”深盟”)
torch: http://torch.ch/(facebook google deepmind twitter fair)
theano: http://deeplearning.net/software/theano/(the lisa group at the university of montreal(蒙特利尔))
tensorflow: https://www.tensorflow.org/(google)
cntk(微软深度学习工具包 )
deeplearning4j: http://deeplearning4j.org/
deepmat: https://github.com/kyunghyuncho/deepmat
neon: http://neon.nervanasys.com/docs/latest/index.html
eblearn: http://eblearn.sourceforge.net/
pylearn: http://deeplearning.net/software/pylearn2/
chainer: https://github.com/pfnet/chainer
bahrampour s, ramakrishnan n, schott l, et al. comparative study of deep learning software frameworks[j]. computer science, 2016.
这篇文章对现在流行的五个开源深度学习框架 caffe、neon、tensorflow、theano、torch 做了很严谨比较。作者开源了他们的比较 benchmarks 代码:https://github.com/dl-benchmarks/dl-benchmarks
文章比较了:可扩展性(extensibility)、hardware utilization(硬件利用率)和速度(speed)三个方面
- 评估测试都是部署在单机上,对于多线程 cpu、gpu(nvidia titan x)都进行测试
- 速度评估标准包括了梯度计算时间(gradient computation time)、前向传播时间(forward time)对于卷积神经网络,作者还
- 对这几个深度框架支持的不同的卷积算法以及相应的性能表现做了实验
通过实验得出了以下结论
- theano、torch 是最具扩展性的深度学习框架
- 在 cpu 上的测试性能来看,torch 最优,其次是 theano
- 在 gpu 上的性能表现,对于大规模卷积以及全连接网络,还是 torch 最优,其次是 neon
- theano 在部署和训练 lstm 网络中夺得拔筹caffe 是最容易测试评估性能的标准深度学习框架
- 最后,tensorflow 与 theano 有些相似,是比较灵活的框架,但是其性能表现,目前还比不上上面的几个框架
但是,毕竟这篇文章已经是过去时了,那时候tensorflow 还只能用 cudnn v.2 版本,而我现在已经装的是v5.1版本,而且tensorflow 也已经发布了1.0版本。现在各工具性能如何,还需要新的评测才能说明问题。
变量:创建、初始化、保存和加载
当训练模型时,用变量来存储和更新参数。变量包含张量 (tensor)存放于内存的缓存区。建模时它们需要被明确地初始化,模型训练后它们必须被存储到磁盘。这些变量的值可在之后模型训练和分析是被加载。
本文档描述以下两个tensorflow类。点击以下链接可查看完整的api文档:
tf.variable 类
tf.train.saver 类
参考tensorflow中文社区
- 添加神经层
输入参数有 inputs
, in_size
, out_size
, 和 activation_function
# 添加层 def add_layer(inputs, in_size, out_size, activation_function=none): weights = tf.variable(tf.random_normal([in_size, out_size]), name='weights') biases = tf.variable(tf.zeros([1, out_size]) + 0.1, name='biases') y = tf.matmul(inputs, weights) + biases if activation_function is none: outputs = y else: outputs = activation_function(y) return outputs
- loss
loss = tf.reduce_mean(tf.reduce_sum(tf.square(ys - prediction), reduction_indices=[1]))
分类问题的loss 函数 cross_entropy 交叉熵
loss = tf.reduce_mean(-tf.reduce_sum(ys * tf.log(prediction), reduction_indices=[1]))
- 创建
当创建一个变量时,你将一个张量作为初始值传入构造函数variable()。tensorflow提供了一系列操作符来初始化张量,初始值是常量或是随机值。
注意,所有这些操作符都需要你指定张量的shape。那个形状自动成为变量的shape。变量的shape通常是固定的,但tensorflow提供了高级的机制来重新调整其行列数。
# create two variables. weights = tf.variable(tf.random_normal([784, 200], stddev=0.35), name="weights") biases = tf.variable(tf.zeros([200]), name="biases")
- 初始化
变量的初始化必须在模型的其它操作运行之前先明确地完成。最简单的方法就是添加一个给所有变量初始化的操作,并在使用模型之前首先运行那个操作。
使用tf.global_variables_initializer()
添加一个操作对变量做初始化。记得在完全构建好模型并加载之后再运行那个操作。
# 7.初始化变量 init = tf.global_variables_initializer() # tf.global_variables_initializer()是并行地初始化所有变量 # 有时候会需要用另一个变量的初始化值给当前变量初始化,这就需要注意了 # 用其它变量的值初始化一个新的变量时,使用其它变量的initialized_value()属性。 # 你可以直接把已初始化的值作为新变量的初始值,或者把它当做tensor计算得到一个值赋予新变量。 # w1 = tf.variable(tf.random_normal([784, 200], stddev=0.35), name="w1") # w2 = tf.variable(w1.initialized_value(), name="w2") # 8.启动图 (graph) sess = tf.session() sess.run(init)
- 由另一个变量初始化
你有时候会需要用另一个变量的初始化值给当前变量初始化。由于tf.global_variables_initializer()
是并行地初始化所有变量,所以在有这种需求的情况下需要小心。用其它变量的值初始化一个新的变量时,使用其它变量的initialized_value()
属性。你可以直接把已初始化的值作为新变量的初始值,或者把它当做tensor计算得到一个值赋予新变量。
w1 = tf.variable(tf.random_normal([784, 200], stddev=0.35), name="w1") w2 = tf.variable(w1.initialized_value(), name="w2")
以上就是python神经网络tensorflow简介常用基本操作教程的详细内容,更多关于tensorflow基本操作简介的资料请关注其它相关文章!
上一篇: Mybatis的基础使用和介绍
下一篇: ice_BA路标点边缘化流程