Python机器学习经典实例 中文目录
程序员文章站
2022-03-18 23:46:59
...
[美国] Prateek Joshi 著 陶俊杰 陈小莉 译
作者简介 3
扉页 4
版权页 5
版权声明 6
译者序 8
前言 12
目录 18
第1章 监督学习 22
1.1 简介 22
1.2 数据预处理技术 23
1.2.1 准备工作 23
1.2.2 详细步骤 23
1.3 标记编码方法 25
详细步骤 25
1.4 创建线性回归器 27
1.4.1 准备工作 27
1.4.2 详细步骤 28
1.5 计算回归准确性 30
1.5.1 准备工作 30
1.5.2 详细步骤 31
1.6 保存模型数据 31
详细步骤 31
1.7 创建岭回归器 32
1.7.1 准备工作 32
1.7.2 详细步骤 33
1.8 创建多项式回归器 34
1.8.1 准备工作 34
1.8.2 详细步骤 35
1.9 估算房屋价格 36
1.9.1 准备工作 36
1.9.2 详细步骤 37
1.10 计算特征的相对重要性 38
详细步骤 38
1.11 评估共享单车的需求分布 40
1.11.1 准备工作 40
1.11.2 详细步骤 40
1.11.3 更多内容 42
第2章 创建分类器 45
2.1 简介 45
2.2 建立简单分类器 46
2.2.1 详细步骤 46
2.2.2 更多内容 48
2.3 建立逻辑回归分类器 48
详细步骤 48
2.4 建立朴素贝叶斯分类器 52
详细步骤 52
2.5 将数据集分割成训练集和测试集 53
详细步骤 53
2.6 用交叉验证检验模型准确性 54
2.6.1 准备工作 55
2.6.2 详细步骤 55
2.7 混淆矩阵可视化 56
详细步骤 57
2.8 提取性能报告 58
详细步骤 58
2.9 根据汽车特征评估质量 59
2.9.1 准备工作 59
2.9.2 详细步骤 59
2.10 生成验证曲线 61
详细步骤 62
2.11 生成学习曲线 64
详细步骤 65
2.12 估算收入阶层 66
详细步骤 66
第3章 预测建模 69
3.1 简介 69
3.2 用SVM建立线性分类器 70
3.2.1 准备工作 70
3.2.2 详细步骤 71
3.3 用SVM建立非线性分类器 74
详细步骤 74
3.4 解决类型数量不平衡问题 76
详细步骤 76
3.5 提取置信度 79
详细步骤 79
3.6 寻找最优超参数 81
详细步骤 81
3.7 建立事件预测器 83
3.7.1 准备工作 83
3.7.2 详细步骤 83
3.8 估算交通流量 85
3.8.1 准备工作 85
3.8.2 详细步骤 85
第4章 无监督学习——聚类 88
4.1 简介 88
4.2 用k-means算法聚类数据 88
详细步骤 89
4.3 用矢量量化压缩图片 91
详细步骤 91
4.4 建立均值漂移聚类模型 95
详细步骤 95
4.5 用凝聚层次聚类进行数据分组 97
详细步骤 97
4.6 评价聚类算法的聚类效果 100
详细步骤 100
4.7 用DBSCAN算法自动估算集群数量 103
详细步骤 103
4.8 探索股票数据的模式 107
详细步骤 107
4.9 建立客户细分模型 109
详细步骤 109
第5章 构建推荐引擎 112
5.1 简介 112
5.2 为数据处理构建函数组合 113
详细步骤 113
5.3 构建机器学习流水线 114
5.3.1 详细步骤 114
5.3.2 工作原理 116
5.4 寻找最近邻 116
详细步骤 116
5.5 构建一个KNN分类器 119
5.5.1 详细步骤 119
5.5.2 工作原理 123
5.6 构建一个KNN回归器 123
5.6.1 详细步骤 123
5.6.2 工作原理 125
5.7 计算欧氏距离分数 126
详细步骤 126
5.8 计算皮尔逊相关系数 127
详细步骤 127
5.9 寻找数据集中的相似用户 129
详细步骤 129
5.10 生成电影推荐 130
详细步骤 131
第6章 分析文本数据 133
6.1 简介 133
6.2 用标记解析的方法预处理数据 134
详细步骤 134
6.3 提取文本数据的词干 135
6.3.1 详细步骤 135
6.3.2 工作原理 136
6.4 用词形还原的方法还原文本的基本形式 137
详细步骤 137
6.5 用分块的方法划分文本 138
详细步骤 138
6.6 创建词袋模型 139
6.6.1 详细步骤 139
6.6.2 工作原理 141
6.7 创建文本分类器 142
6.7.1 详细步骤 142
6.7.2 工作原理 144
6.8 识别性别 145
详细步骤 145
6.9 分析句子的情感 146
6.9.1 详细步骤 147
6.9.2 工作原理 149
6.10 用主题建模识别文本的模式 149
6.10.1 详细步骤 149
6.10.2 工作原理 152
第7章 语音识别 153
7.1 简介 153
7.2 读取和绘制音频数据 153
详细步骤 154
7.3 将音频信号转换为频域 155
详细步骤 155
7.4 自定义参数生成音频信号 157
详细步骤 157
7.5 合成音乐 159
详细步骤 159
7.6 提取频域特征 161
详细步骤 161
7.7 创建隐马尔科夫模型 163
详细步骤 163
7.8 创建一个语音识别器 164
详细步骤 165
第8章 解剖时间序列和时序数据 168
8.1 简介 168
8.2 将数据转换为时间序列格式 169
详细步骤 169
8.3 切分时间序列数据 171
详细步骤 171
8.4 操作时间序列数据 173
详细步骤 173
8.5 从时间序列数据中提取统计数字 175
详细步骤 175
8.6 针对序列数据创建隐马尔科夫模型 178
8.6.1 准备工作 179
8.6.2 详细步骤 179
8.7 针对序列文本数据创建条件随机场 182
8.7.1 准备工作 182
8.7.2 详细步骤 182
8.8 用隐马尔科夫模型分析股票市场数据 185
详细步骤 185
第9章 图像内容分析 187
9.1 简介 187
9.2 用OpenCV-Pyhon操作图像 188
详细步骤 188
9.3 检测边 191
详细步骤 191
9.4 直方图均衡化 195
详细步骤 195
9.5 检测棱角 197
详细步骤 198
9.6 检测SIFT特征点 199
详细步骤 200
9.7 创建Star特征检测器 201
详细步骤 202
9.8 利用视觉码本和向量量化创建特征 203
详细步骤 203
9.9 用极端随机森林训练图像分类器 206
详细步骤 206
9.10 创建一个对象识别器 208
详细步骤 208
第10章 人脸识别 210
10.1 简介 210
10.2 从网络摄像头采集和处理视频信息 210
详细步骤 211
10.3 用Haar级联创建一个人脸识别器 212
详细步骤 212
10.4 创建一个眼睛和鼻子检测器 214
详细步骤 214
10.5 做主成分分析 217
详细步骤 217
10.6 做核主成分分析 218
详细步骤 219
10.7 做盲源分离 222
详细步骤 222
10.8 用局部二值模式直方图创建一个人脸识别器 226
详细步骤 226
第11章 深度神经网络 231
11.1 简介 231
11.2 创建一个感知器 232
详细步骤 232
11.3 创建一个单层神经网络 234
详细步骤 234
11.4 创建一个深度神经网络 237
详细步骤 237
11.5 创建一个向量量化器 240
详细步骤 240
11.6 为序列数据分析创建一个递归神经网络 242
详细步骤 243
11.7 在光学字符识别数据库中将字符可视化 246
详细步骤 246
11.8 用神经网络创建一个光学字符识别器 247
详细步骤 248
第12章 可视化数据 251
12.1 简介 251
12.2 画3D散点图 251
详细步骤 252
12.3 画气泡图 253
详细步骤 253
12.4 画动态气泡图 254
详细步骤 254
12.5 画饼图 256
详细步骤 256
12.6 画日期格式的时间序列数据 258
详细步骤 258
12.7 画直方图 260
详细步骤 260
12.8 可视化热力图 262
详细步骤 262
12.9 动态信号的可视化模拟 263
详细步骤 263
延展阅读 266
连接图灵 268
看完了 270
作者简介 3
扉页 4
版权页 5
版权声明 6
译者序 8
前言 12
目录 18
第1章 监督学习 22
1.1 简介 22
1.2 数据预处理技术 23
1.2.1 准备工作 23
1.2.2 详细步骤 23
1.3 标记编码方法 25
详细步骤 25
1.4 创建线性回归器 27
1.4.1 准备工作 27
1.4.2 详细步骤 28
1.5 计算回归准确性 30
1.5.1 准备工作 30
1.5.2 详细步骤 31
1.6 保存模型数据 31
详细步骤 31
1.7 创建岭回归器 32
1.7.1 准备工作 32
1.7.2 详细步骤 33
1.8 创建多项式回归器 34
1.8.1 准备工作 34
1.8.2 详细步骤 35
1.9 估算房屋价格 36
1.9.1 准备工作 36
1.9.2 详细步骤 37
1.10 计算特征的相对重要性 38
详细步骤 38
1.11 评估共享单车的需求分布 40
1.11.1 准备工作 40
1.11.2 详细步骤 40
1.11.3 更多内容 42
第2章 创建分类器 45
2.1 简介 45
2.2 建立简单分类器 46
2.2.1 详细步骤 46
2.2.2 更多内容 48
2.3 建立逻辑回归分类器 48
详细步骤 48
2.4 建立朴素贝叶斯分类器 52
详细步骤 52
2.5 将数据集分割成训练集和测试集 53
详细步骤 53
2.6 用交叉验证检验模型准确性 54
2.6.1 准备工作 55
2.6.2 详细步骤 55
2.7 混淆矩阵可视化 56
详细步骤 57
2.8 提取性能报告 58
详细步骤 58
2.9 根据汽车特征评估质量 59
2.9.1 准备工作 59
2.9.2 详细步骤 59
2.10 生成验证曲线 61
详细步骤 62
2.11 生成学习曲线 64
详细步骤 65
2.12 估算收入阶层 66
详细步骤 66
第3章 预测建模 69
3.1 简介 69
3.2 用SVM建立线性分类器 70
3.2.1 准备工作 70
3.2.2 详细步骤 71
3.3 用SVM建立非线性分类器 74
详细步骤 74
3.4 解决类型数量不平衡问题 76
详细步骤 76
3.5 提取置信度 79
详细步骤 79
3.6 寻找最优超参数 81
详细步骤 81
3.7 建立事件预测器 83
3.7.1 准备工作 83
3.7.2 详细步骤 83
3.8 估算交通流量 85
3.8.1 准备工作 85
3.8.2 详细步骤 85
第4章 无监督学习——聚类 88
4.1 简介 88
4.2 用k-means算法聚类数据 88
详细步骤 89
4.3 用矢量量化压缩图片 91
详细步骤 91
4.4 建立均值漂移聚类模型 95
详细步骤 95
4.5 用凝聚层次聚类进行数据分组 97
详细步骤 97
4.6 评价聚类算法的聚类效果 100
详细步骤 100
4.7 用DBSCAN算法自动估算集群数量 103
详细步骤 103
4.8 探索股票数据的模式 107
详细步骤 107
4.9 建立客户细分模型 109
详细步骤 109
第5章 构建推荐引擎 112
5.1 简介 112
5.2 为数据处理构建函数组合 113
详细步骤 113
5.3 构建机器学习流水线 114
5.3.1 详细步骤 114
5.3.2 工作原理 116
5.4 寻找最近邻 116
详细步骤 116
5.5 构建一个KNN分类器 119
5.5.1 详细步骤 119
5.5.2 工作原理 123
5.6 构建一个KNN回归器 123
5.6.1 详细步骤 123
5.6.2 工作原理 125
5.7 计算欧氏距离分数 126
详细步骤 126
5.8 计算皮尔逊相关系数 127
详细步骤 127
5.9 寻找数据集中的相似用户 129
详细步骤 129
5.10 生成电影推荐 130
详细步骤 131
第6章 分析文本数据 133
6.1 简介 133
6.2 用标记解析的方法预处理数据 134
详细步骤 134
6.3 提取文本数据的词干 135
6.3.1 详细步骤 135
6.3.2 工作原理 136
6.4 用词形还原的方法还原文本的基本形式 137
详细步骤 137
6.5 用分块的方法划分文本 138
详细步骤 138
6.6 创建词袋模型 139
6.6.1 详细步骤 139
6.6.2 工作原理 141
6.7 创建文本分类器 142
6.7.1 详细步骤 142
6.7.2 工作原理 144
6.8 识别性别 145
详细步骤 145
6.9 分析句子的情感 146
6.9.1 详细步骤 147
6.9.2 工作原理 149
6.10 用主题建模识别文本的模式 149
6.10.1 详细步骤 149
6.10.2 工作原理 152
第7章 语音识别 153
7.1 简介 153
7.2 读取和绘制音频数据 153
详细步骤 154
7.3 将音频信号转换为频域 155
详细步骤 155
7.4 自定义参数生成音频信号 157
详细步骤 157
7.5 合成音乐 159
详细步骤 159
7.6 提取频域特征 161
详细步骤 161
7.7 创建隐马尔科夫模型 163
详细步骤 163
7.8 创建一个语音识别器 164
详细步骤 165
第8章 解剖时间序列和时序数据 168
8.1 简介 168
8.2 将数据转换为时间序列格式 169
详细步骤 169
8.3 切分时间序列数据 171
详细步骤 171
8.4 操作时间序列数据 173
详细步骤 173
8.5 从时间序列数据中提取统计数字 175
详细步骤 175
8.6 针对序列数据创建隐马尔科夫模型 178
8.6.1 准备工作 179
8.6.2 详细步骤 179
8.7 针对序列文本数据创建条件随机场 182
8.7.1 准备工作 182
8.7.2 详细步骤 182
8.8 用隐马尔科夫模型分析股票市场数据 185
详细步骤 185
第9章 图像内容分析 187
9.1 简介 187
9.2 用OpenCV-Pyhon操作图像 188
详细步骤 188
9.3 检测边 191
详细步骤 191
9.4 直方图均衡化 195
详细步骤 195
9.5 检测棱角 197
详细步骤 198
9.6 检测SIFT特征点 199
详细步骤 200
9.7 创建Star特征检测器 201
详细步骤 202
9.8 利用视觉码本和向量量化创建特征 203
详细步骤 203
9.9 用极端随机森林训练图像分类器 206
详细步骤 206
9.10 创建一个对象识别器 208
详细步骤 208
第10章 人脸识别 210
10.1 简介 210
10.2 从网络摄像头采集和处理视频信息 210
详细步骤 211
10.3 用Haar级联创建一个人脸识别器 212
详细步骤 212
10.4 创建一个眼睛和鼻子检测器 214
详细步骤 214
10.5 做主成分分析 217
详细步骤 217
10.6 做核主成分分析 218
详细步骤 219
10.7 做盲源分离 222
详细步骤 222
10.8 用局部二值模式直方图创建一个人脸识别器 226
详细步骤 226
第11章 深度神经网络 231
11.1 简介 231
11.2 创建一个感知器 232
详细步骤 232
11.3 创建一个单层神经网络 234
详细步骤 234
11.4 创建一个深度神经网络 237
详细步骤 237
11.5 创建一个向量量化器 240
详细步骤 240
11.6 为序列数据分析创建一个递归神经网络 242
详细步骤 243
11.7 在光学字符识别数据库中将字符可视化 246
详细步骤 246
11.8 用神经网络创建一个光学字符识别器 247
详细步骤 248
第12章 可视化数据 251
12.1 简介 251
12.2 画3D散点图 251
详细步骤 252
12.3 画气泡图 253
详细步骤 253
12.4 画动态气泡图 254
详细步骤 254
12.5 画饼图 256
详细步骤 256
12.6 画日期格式的时间序列数据 258
详细步骤 258
12.7 画直方图 260
详细步骤 260
12.8 可视化热力图 262
详细步骤 262
12.9 动态信号的可视化模拟 263
详细步骤 263
延展阅读 266
连接图灵 268
看完了 270
推荐阅读
-
Python机器学习k-近邻算法(K Nearest Neighbor)实例详解
-
python机器学习库sklearn之DBSCAN密度聚类实例
-
python机器学习库sklearn的多类、多标签、多输出实例讲解
-
Python机器学习之决策树算法实例详解
-
python保存加载机器学习模型实例
-
Python机器学习 (Python Machine Learning 中文版 PDF)
-
Python3入门机器学习经典算法与应用——knn算法数据归一化 Feature Scaling
-
Python机器学习NLP自然语言处理基本操作之命名实例提取
-
Python机器学习中文版
-
Python机器学习k-近邻算法(K Nearest Neighbor)实例详解