《机器学习案例实战》PDF电子书免费下载

作者:  赵卫东

出版社: 人民邮电出版社

出版年: 2019年12月

ISBN: 9787115514103

~~滚到底部有网盘下载链接~~

内容简介

目录

第1章 常用机器学习平台. 1
1.1 常用机器学习工具1
1.2 TI-ONE 平台概述3
1.3 PySpark 介绍4
1.4 TI-ONE 机器学习平台主要的组件5
1.4.1 数据源组件 5
1.4.2 机器学习组件 6
1.4.3 输出组件10
1.4.4 模型评估组件 11
第 2章 银行信用卡风险的可视化分析. 12
2.1 Tableau 简介13
2.2 用户信用等级影响因素13
2.3 用户消费情况对信用等级的影响.19
2.4 用户拖欠情况对信用等级的影响.24
2.5 欺诈用户特征分析27
第3章 贷款违约行为预测. 31
3.1 建立信用评估模型的必要性31
3.2 数据准备与预处理32
3.2.1 原始数据集 33
3.2.2 基础表数据预处理 36
3.2.3 多表合并40
3.3 模型选择.42
3.3.1 带正则项的Logistic 回归模型 42
3.3.2 朴素贝叶斯模型 42
3.3.3 随机森林模型 42
3.3.4 SVM 模型 43
3.4 TI-ONE 整体流程43
3.4.1 登录TI-ONE 44
3.4.2 输入工作流名称 44
3.4.3 上传数据 45
3.4.4 数据预处理 46
3.4.5 拆分出验证集 50
3.4.6 拆分出测试集 51
3.4.7 模型训练和评估 51
第4章 保险风险预测.61
4.1 背景介绍 61
4.2 数据预处理63
4.2.1 数据加载与预览 63
4.2.2 缺失值处理 64
4.2.3 属性值的合并与连接 65
4.2.4 数据转换 66
4.2.5 数据标准化和归一化 67
4.3 多维分析.67
4.4 基于神经网络模型预测保险风险.70
4.5 使用SVM 预测保险风险.74
第5章 银行客户流失预测 80
5.1 问题描述 80
5.2 数据上传.82
5.3 数据预处理83
5.3.1 非数值特征处理 83
5.3.2 数据离散化处理 83
5.3.3 数据筛选 85
5.3.4 数据格式转化 86
5.3.5 数据分割 87
5.4 数据建模 88
5.5 模型校验评估 91
5.5.1 二分类算法评估 91
5.5.2 ROC 曲线绘制. 92
5.5.3 决策树参数优化 94
5.5.4 k 折交叉验证. 95
5.6 工作流的运行.95
5.7 算法性能比较.98
第6章 基于深度神经网络的股票预测 100
6.1 股票趋势预测的背景和分析思路100
6.2 数据提取.103
6.3 数据预处理103
6.3.1 数据归一化103
6.3.2 加窗处理104
6.3.3 分割数据集106
6.3.4 标签独热编码转化106
6.4 模型训练.106
6.5 算法评估.110
6.6 算法比较.111
第7章 保险产品推荐119
7.1 保险产品推荐的流程.120
7.2 数据提取.121
7.2.1 上传原始文件 121
7.2.2 读取训练集和检验集 122
7.3 数据预处理124
7.3.1 去重和合并数据集124
7.3.2 缺失值处理 125
7.3.3 特征选择 126
7.3.4 类型变量独热编码 127
7.3.5 数值变量规范化 127
7.3.6 生成训练集和检验集 128
7.4 构建保险预测模型129
7.5 模型评估.131
第8章 零售商品销售预测. 133
8.1 问题分析.133
8.2 数据探索.135
8.2.1 上传原始数据 135
8.2.2 数据质量评估 136
8.3 数据预处理139
8.3.1 填补缺失值 139
8.3.2 修正异常值 140
8.3.3 衍生字段 141
8.3.4 类型变量数值化和独热编码化 142
8.3.5 数据导出 143
8.4 建立销售量预测模型.143
8.4.1 线性回归模型 144
8.4.2 Ridge 回归模型. 145
8.4.3 Lasso 回归模型. 145
8.4.4 Elastic Net 回归模型. 146
8.4.5 决策树回归模型 146
8.4.6 梯度提升树回归模型 147
8.4.7 随机森林回归模型 148
8.5 模型评估.148
第9章 汽车备件销售预测. 151
9.1 数据理解.151
9.2 数据分析流程.152
9.2.1 设置数据源 152
9.2.2 数据预处理 155
9.2.3 建模分析与评估 158
9.3 聚类分析.162
第 10章 火力发电厂工业蒸汽量预测.166
10.1 确定业务问题.166
10.2 数据理解.166
10.3 工业蒸汽量的预测建模过程167
10.3.1 设置数据源 168
10.3.2 数据预处理 168
10.3.3 建模分析与评估 172
第 11章 图片风格转化.179
11.1 CycleGAN 原理.180
11.2 图片风格转化整体流程182
11.2.1 设置数据源 183
11.2.2 数据预处理184
11.2.3 模型训练 186
11.2.4 验证模型参数以及测试集 193
11.2.5 模型测试——转化图片风格194
11.3 运行工作流195
11.4 算法比较.198
11.4.1 CycleGAN 与pix2pix 模型. 198
11.4.2 CycleGAN 与DistanceGAN 模型 198
11.5 使用TensorFlow 实现图片风格转化.199
第 12章 人类活动识别.206
12.1 问题分析.206
12.2 数据探索.207
12.3 数据预处理209
12.4 模型构建.210
12.5 模型评估.214
第 13章 GRU 算法在基于Session 的推荐系统的应用 221
13.1 问题分析.221
13.2 数据探索与预处理222
13.2.1 数据变换 223
13.2.2 数据过滤 223
13.2.3 数据分割 223
13.2.4 格式转换224
13.3 构建GRU 模型225
13.3.1 GRU 概述 225
13.3.2 构建GRU 推荐模型. 226
13.4 模型评估.229
第 14章 人脸老化预测 233
14.1 问题分析与数据集简介233
14.2 图片编码与GAN 设计.234
14.3 模型实现.235
14.4 实验分析.236
第 15章 出租车轨迹数据分析 243
15.1 数据获取.244
15.2 数据预处理246
15.3 数据分析.252
15.3.1 出租车区域推荐以及交通管理建议 252
15.3.2 城市规划建议 257
第 16章 城市声音分类.261
16.1 数据准备与探索261
16.2 数据特征提取.268
16.3 构建城市声音分类模型271
16.3.1 使用MLP 训练声音分类模型 271
16.3.2 使用LSTM 与GRU 网络训练声音分类模型. 273
16.3.3 使用CNN 训练声音分类模型 274
16.4 声音分类模型评估275
16.4.1 MLP 网络性能评估 275
16.4.2 LSTM 与GRU 网络性能评估. 276
16.4.3 CNN 性能评估 277
后记 数据分析技能培养 279
参考文献. 282

下载价格:免费
立即下载
登入/注册
知识就是力量
没有账号? 忘记密码?