作者: [意] 朱塞佩·博纳科尔索(Giuseppe Bonaccorso)
出版社: 机械工业出版社
出版年: 2020-04
ISBN: 9787111645788
~~滚到底部有网盘下载链接~~
内容简介
本书介绍了数据科学领域常用的所有重要机器学习算法以及TensorFlow和特征工程等相关内容。涵盖的算法包括线性回归、逻辑回归、支持向量机、朴素贝叶斯、k均值、随机森林等,这些算法可以用于监督学习、非监督学习、强化学习或半监督学习。在本书中,你将学会如何使用这些算法来解决所遇到的问题,并了解这些算法的工作方式。本书还将介绍自然语言处理和推荐系统,这些内容将帮助大家进行多种算法的实践。
朱塞佩·博纳科尔索(Giuseppe Bonaccorso),一家大型跨国公司的数据科学主管。他拥有意大利卡塔尼亚大学电子工程专业工程学硕士学位,然后在意大利罗马第二大学、英国埃塞克斯大学深造过。在他的职业生涯中,担任过公共管理、军事、公用事业、医疗保健、诊断和广告等多个业务领域的IT工程师,使用Java、Python、Hadoop、Spark、Theano和TensorFlow等多种技术进行过项目开发与管理。他的主要研究兴趣包括人工智能、机器学习、深度学习、强化学习、数据科学等。
译者:罗娜,博士,副研究员,在华东理工大学信息科学工程学院任教。研究方向为机器学习算法及其在工业中的应用。作为项目负责人,先后承担了国家自然科学基金青年科学基金、上海市自然科学基金等多项课题的研究工作,并作为技术负责人承担了多项中石化科技攻关项目,发表相关学术论文20余篇,申请国家发明专利两项,登记软件著作权两项。
朱塞佩·博纳科尔索(Giuseppe Bonaccorso),一家大型跨国公司的数据科学主管。他拥有意大利卡塔尼亚大学电子工程专业工程学硕士学位,然后在意大利罗马第二大学、英国埃塞克斯大学深造过。在他的职业生涯中,担任过公共管理、军事、公用事业、医疗保健、诊断和广告等多个业务领域的IT工程师,使用Java、Python、Hadoop、Spark、Theano和TensorFlow等多种技术进行过项目开发与管理。他的主要研究兴趣包括人工智能、机器学习、深度学习、强化学习、数据科学等。
译者:罗娜,博士,副研究员,在华东理工大学信息科学工程学院任教。研究方向为机器学习算法及其在工业中的应用。作为项目负责人,先后承担了国家自然科学基金青年科学基金、上海市自然科学基金等多项课题的研究工作,并作为技术负责人承担了多项中石化科技攻关项目,发表相关学术论文20余篇,申请国家发明专利两项,登记软件著作权两项。
目录
译者序
前言
第1章 机器学习简介
1.1 简介——经典机器和自适应的机器
1.2 关于学习
1.3 超越机器学习——深度学习和基于生物启发的适应系统
1.4 机器学习和大数据
1.5 本章小结
第2章 机器学习的重要元素
2.1 数据格式
2.2 可学习性
2.3 统计学习方法介绍
2.4 类平衡
2.5 信息论的要素
2.6 本章小结
第3章 特征选择与特征工程
3.1 scikit-learn的toy数据集
3.2 创建训练集和测试集
3.3 管理分类数据
3.4 管理缺失特征
3.5 数据缩放和归一化
3.6 特征选择和过滤
3.7 主成分分析
3.8 独立成分分析
3.9 原子提取和字典学习
3.10 使用t-SNE可视化高维数据集
3.11 本章小结
第4章 回归算法
4.1 线性模型
4.2 一个二维的例子
4.3 基于scikit-learn的线性回归和更高维
4.4 Ridge回归、Lasso回归和ElasticNet
4.5 稳健回归
4.6 贝叶斯回归
4.7 多项式回归
4.8 保序回归
4.9 本章小结
第5章 线性分类算法
5.1 线性分类
5.2 逻辑回归
5.3 实现和优化
5.4 随机梯度下降算法
5.5 被动攻击算法
5.6 通过网格搜索找到最优超参数
5.7 评估分类的指标
5.8 ROC曲线
5.9 本章小结
第6章 朴素贝叶斯和判别分析
6.1 贝叶斯定理
6.2 朴素贝叶斯分类器
6.3 scikit-learn中的朴素贝叶斯
6.4 判别分析
6.5 本章小结
第7章 支持向量机
7.1 线性支持向量机
7.2 scikit-learn实现
7.3 基于内核的分类
7.4 受控支持向量机
7.5 支持向量回归
7.6 半监督支持向量机简介
7.7 本章小结
第8章 决策树和集成学习
8.1 二元决策树
8.2 基于scikit-learn的决策树分类
8.3 决策树回归
8.4 集成学习简介
8.5 本章小结
第9章 聚类原理
9.1 聚类基础
9.2 k-NN算法
9.3 高斯混合
9.4 k-means
9.5 基于样本标记的评价方法
9.6 本章小结
第10章 高级聚类
10.1 DBSCAN
10.2 谱聚类
10.3 在线聚类
10.4 双聚类
10.5 本章小结
第11章 层次聚类
11.1 分层策略
11.2 凝聚聚类
11.3 本章小结
第12章 推荐系统介绍
12.1 朴素的基于用户的系统
12.2 基于内容的系统
12.3 无模式(或基于内存的)协同过滤
12.4 基于模型的协同过滤
12.5 本章小结
第13章 自然语言处理简介
13.1 NLTK和内置语料库
13.2 词袋策略
13.3 词性
13.4 示例文本分类器
13.5 本章小结
第14章 NLP中的主题建模与情感分析
14.1 主题建模
14.2 使用Gensim的Word2vec简介
14.3 情感分析
14.4 本章小结
第15章 神经网络介绍
15.1 深度学习简介
15.2 基于Keras的MLP
15.3 本章小结
第16章 高级深度学习模型
16.1 深层结构
16.2 基于Keras的深度卷积网络示例
16.3 基于Keras的LSTM网络示例
16.4 TensorFlow简介
16.5 本章小结
第17章 创建机器学习架构
17.1 机器学习框架
17.2 用于机器学习架构的scikit-learn工具
17.3 本章小结
前言
第1章 机器学习简介
1.1 简介——经典机器和自适应的机器
1.2 关于学习
1.3 超越机器学习——深度学习和基于生物启发的适应系统
1.4 机器学习和大数据
1.5 本章小结
第2章 机器学习的重要元素
2.1 数据格式
2.2 可学习性
2.3 统计学习方法介绍
2.4 类平衡
2.5 信息论的要素
2.6 本章小结
第3章 特征选择与特征工程
3.1 scikit-learn的toy数据集
3.2 创建训练集和测试集
3.3 管理分类数据
3.4 管理缺失特征
3.5 数据缩放和归一化
3.6 特征选择和过滤
3.7 主成分分析
3.8 独立成分分析
3.9 原子提取和字典学习
3.10 使用t-SNE可视化高维数据集
3.11 本章小结
第4章 回归算法
4.1 线性模型
4.2 一个二维的例子
4.3 基于scikit-learn的线性回归和更高维
4.4 Ridge回归、Lasso回归和ElasticNet
4.5 稳健回归
4.6 贝叶斯回归
4.7 多项式回归
4.8 保序回归
4.9 本章小结
第5章 线性分类算法
5.1 线性分类
5.2 逻辑回归
5.3 实现和优化
5.4 随机梯度下降算法
5.5 被动攻击算法
5.6 通过网格搜索找到最优超参数
5.7 评估分类的指标
5.8 ROC曲线
5.9 本章小结
第6章 朴素贝叶斯和判别分析
6.1 贝叶斯定理
6.2 朴素贝叶斯分类器
6.3 scikit-learn中的朴素贝叶斯
6.4 判别分析
6.5 本章小结
第7章 支持向量机
7.1 线性支持向量机
7.2 scikit-learn实现
7.3 基于内核的分类
7.4 受控支持向量机
7.5 支持向量回归
7.6 半监督支持向量机简介
7.7 本章小结
第8章 决策树和集成学习
8.1 二元决策树
8.2 基于scikit-learn的决策树分类
8.3 决策树回归
8.4 集成学习简介
8.5 本章小结
第9章 聚类原理
9.1 聚类基础
9.2 k-NN算法
9.3 高斯混合
9.4 k-means
9.5 基于样本标记的评价方法
9.6 本章小结
第10章 高级聚类
10.1 DBSCAN
10.2 谱聚类
10.3 在线聚类
10.4 双聚类
10.5 本章小结
第11章 层次聚类
11.1 分层策略
11.2 凝聚聚类
11.3 本章小结
第12章 推荐系统介绍
12.1 朴素的基于用户的系统
12.2 基于内容的系统
12.3 无模式(或基于内存的)协同过滤
12.4 基于模型的协同过滤
12.5 本章小结
第13章 自然语言处理简介
13.1 NLTK和内置语料库
13.2 词袋策略
13.3 词性
13.4 示例文本分类器
13.5 本章小结
第14章 NLP中的主题建模与情感分析
14.1 主题建模
14.2 使用Gensim的Word2vec简介
14.3 情感分析
14.4 本章小结
第15章 神经网络介绍
15.1 深度学习简介
15.2 基于Keras的MLP
15.3 本章小结
第16章 高级深度学习模型
16.1 深层结构
16.2 基于Keras的深度卷积网络示例
16.3 基于Keras的LSTM网络示例
16.4 TensorFlow简介
16.5 本章小结
第17章 创建机器学习架构
17.1 机器学习框架
17.2 用于机器学习架构的scikit-learn工具
17.3 本章小结