欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页

TensorFlow学习(5)——TensorFlow的基本使用

程序员文章站 2024-03-15 14:02:05
...

本节学习目标:

  • 学习基本的 TensorFlow 概念
  • 在 TensorFlow 中使用 LinearRegressor 类并基于单个输入特征预测各城市街区的房屋价值中位数
  • 使用均方根误差 (RMSE) 评估模型预测的准确率
  • 通过调整模型的超参数提高模型准确率

TensorFlow框架概览

以下是TensorFlow的架构体系:
TensorFlow学习(5)——TensorFlow的基本使用

我们一般用到的是 TensorFlow Estimators层,该层相对比较容易,易于入手,本学习大部分内容也都是介绍Estimator层的使用。随着应用的熟练,我们可以逐步往下学习,自定义编程更加灵活轻便。下面进入本节的主要内容:

引入并检查数据

首先引入必要的依赖库:

from __future__ import print_function

import math

from IPython import display
from matplotlib import cm
from matplotlib import gridspec
from matplotlib import pyplot as plt
import numpy as np
import pandas as pd
from sklearn import metrics
import tensorflow as tf
from tensorflow.python.data import Dataset

tf.logging.set_verbosity(tf.logging.ERROR)
pd.options.display.max_rows = 10
pd.options.display.float_format = '{:.1f}'.format

这里有几个库要进行另外下载安装,首先找到Scripts目录(我这里是\Python\Python35\Scripts),然后分别安装IPython、sklearn、scipy

pip install IPython

pip install sklearn

pip install scipy

加载数据:

california_housing_dataframe = pd.read_csv("https://download.mlcc.google.cn/mledu-datasets/california_housing_train.csv", sep=",")

对数据进行随机化处理:

california_housing_dataframe = california_housing_dataframe.reindex(
    np.random.permutation(california_housing_dataframe.index))

将 median_house_value 调整为以千为单位:

california_housing_dataframe["median_house_value"] /= 1000.0

检查数据,输出快速摘要:样本数、均值、标准偏差、最大值、最小值和各种分位数等:

print(california_housing_dataframe.describe())

摘要输出结果如下:
TensorFlow学习(5)——TensorFlow的基本使用

构建第一个模型