《基于机器学习的数据缺失值填补:理论与方法》PDF电子书免费下载

作者:  赖晓晨 张立勇 刘辉 吴霞

出版社: 机械工业出版社

出版年: 2020年09月

ISBN: 9787111663058

~~滚到底部有网盘下载链接~~

内容简介

目录

前言
第1章 绪论 1
1.1 缺失值填补的背景与意义 1
1.2 缺失值填补方法的研究现状概述 3
1.2.1 基于统计学的缺失值填补方法 3
1.2.2 基于机器学习的缺失值填补方法 4
1.3 缺失值填补的应用 7
1.4 本章小结 10
参考文献 11
第2章 缺失数据的处理方法 14
2.1 数据缺失机制 14
2.1.1 完全随机缺失 15
2.1.2 随机缺失 15
2.1.3 非随机缺失 16
2.2 缺失数据的处理 17
2.2.1 不做处理 17
2.2.2 不完整样本删除 19
2.2.3 缺失值填补 20
2.3 缺失值填补概述 22
2.3.1 基本概念 22
2.3.2 方法分类 24
2.3.3 性能度量 26
2.4 本章小结 29
参考文献 29
第3章 缺失值填补方法 31
3.1 基于样本间相似度的填补方法 31
3.1.1 均值填补法 31
3.1.2 热平台填补法 34
3.1.3 K近邻填补法 36
3.1.4 基于聚类的填补方法 39
3.2 基于属性间相关性的填补方法 46
3.2.1 基于线性回归的填补方法 46
3.2.2 基于非线性回归的填补方法 51
3.2.3 基于神经网络的填补方法 54
3.3 基于参数估计的期望化填补方法 60
3.3.1 参数估计法 60
3.3.2 期望化填补法 63
3.4 针对缺失数据不确定性的填补方法 66
3.4.1 多重填补法 67
3.4.2 基于证据理论的填补方法 72
3.5 本章小结 78
参考文献 79
第4章 面向不完整数据的神经网络填补方法 81
4.1 基于自组织映射网络的填补方法 81
4.1.1 自组织映射网络理论 81
4.1.2 自组织映射网络的缺失值处理 85
4.2 基于单层感知机的填补方法 87
4.2.1 单层感知机理论 87
4.2.2 传统单层感知机的改进 88
4.2.3 单层感知机填补模型 89
4.3 基于多层感知机的填补方法 91
4.3.1 多层感知机理论 91
4.3.2 基于多层感知机集群的填补方法 93
4.3.3 基于多层感知机简化集群的填补方法 95
4.4 基于自编码器及其变体的填补方法 96
4.4.1 基于自编码器的填补法 97
4.4.2 基于径向基函数自编码器的填补法 99
4.4.3 基于广义回归自编码器的填补法 102
4.4.4 基于对偶传播自编码器的填补法 104
4.4.5 基于极限学习机自编码器的填补法 106
4.5 面向不完整数据的属性关联型神经元建模与填补方法 107
4.5.1 基于去跟踪自编码器的填补法 108
4.5.2 基于关联增强型自编码器的填补法 112
4.5.3 基于多任务学习的填补方法 114
4.6 典型神经网络填补模型实验 117
4.6.1 实验设计 118
4.6.2 不同网络模型的填补精度 120
4.6.3 自编码器的自跟踪性 121
4.6.4 去跟踪自编码器的去跟踪性 123
4.7 本章小结 124
参考文献 124
第5章 神经网络填补方法的优化设计 127
5.1 面向不完整数据的代价函数 127
5.2 两阶段式填补方案 131
5.2.1 训练阶段 132
5.2.2 填补阶段 135
5.3 融合式填补方案 143
5.3.1 基于缺失值变量的神经网络动态填补方案 143
5.3.2 缺失值变量与模型参数的动态更新 144
5.3.3 时间复杂度 147
5.4 典型神经网络填补方案实验 149
5.4.1 实验设计 149
5.4.2 不同填补方案的填补精度 152
5.4.3 MVPT填补方案的收敛性 154
5.5 本章小结 155
参考文献 156
第6章 基于TS建模的非线性回归填补法 157
6.1 模糊数学基础 157
6.1.1 模糊数学与模糊集合 157
6.1.2 模糊数学在缺失值填补中的应用 158
6.2 TS模型 159
6.2.1 TS模型基本结构 159
6.2.2 TS模型研究与应用现状 160
6.3 基于TS模型的填补方法 163
6.3.1 基于TS模型的填补方法概述 163
6.3.2 前提参数获取 165
6.3.3 结论参数获取 168
6.3.4 缺失值填补 169
6.4 基于特征选择的TS模型填补法 170
6.4.1 特征选择算法概述 170
6.4.2 基于特征选择的TS模型填补法 177
6.5 TS模型填补方法实验 178
6.5.1 实验设计 178
6.5.2 TS模型与回归模型的填补效果对比 179
6.5.3 特征选择对TS模型拟合精度的影响 181
6.5.4 特征选择对TS模型填补精度的影响 183
6.6 本章小结 186
参考文献 186
第7章 TS模型填补方法的优化设计 188
7.1 面向类不均衡数据的TS模型优化 188
7.1.1 TS模型中的FCM算法 188
7.1.2 FCM算法存在的问题 190
7.1.3 DPC算法 192
7.1.4 类不均衡数据的MDF算法 195
7.1.5 MDF算法实验 196
7.2 基于交替学习策略的TS模型填补方法 204
7.2.1 TS结论参数与填补值的交替学习策略 206
7.2.2 交替学习策略的迭代收敛性 208
7.2.3 交替学习策略下线性回归填补法实验 209
7.2.4 交替学习策略下TS模型填补法实验 210
7.3 本章小结 212
参考文献 212
第8章 基于缺失值填补的中国贫困家庭特征分析 213
8.1 精准扶贫过程中的数据缺失问题 213
8.1.1 我国贫困问题研究 213
8.1.2 中国家庭追踪调查中的数据缺失问题 214
8.2 CFPS数据集缺失值填补 216
8.2.1 基于去跟踪自编码器的动态缺失值填补 216
8.2.2 缺失值填补精度 217
8.3 贫困家庭识别 219
8.3.1 多维贫困测度 219
8.3.2 贫困的维度指标及临界剥夺值 220
8.3.3 基于层次分析法的多维贫困指标权重计算 223
8.3.4 CFPS2016数据集的多维贫困家庭识别 227
8.4 基于聚类算法的贫困家庭类别划分 229
8.4.1 层次聚类算法 229
8.4.2 贫困家庭聚类 230
8.5 贫困家庭典型特征分析 232
8.5.1 多重聚类特征选择算法 232
8.5.2 贫困家庭典型特征选择 233
8.6 本章小结 235
参考文献 236
显示部分信息

下载价格:免费
立即下载
登入/注册
知识就是力量
没有账号? 忘记密码?