作者: 史卫亚
出版社: 北京大学出版社
出版年: 2020年
ISBN: 9787301312827
~~滚到底部有网盘下载链接~~
内容简介
本书通过精选案例引导读者系统学习,系统完整地介绍了网络爬虫的开发知识和技巧。 本书主要基于Python 3.7开发网络爬虫,主要内容包括认识爬虫、爬虫需要具备的基础知识、数据提取的方式、如何提高爬虫的效率、数据的存储、动态页面的爬取、机器识别、模拟登陆、设置代理IP、Scrapy爬虫框架和分布式爬虫等知识点。为了让读者更好的掌握这些技术和更多的了解爬虫的功能,本书后提供了九个实战项目,通过大量案例操作,来让读者提高爬虫的反爬和数据提取等爬虫技术实战的能力。 本书不仅适合零基础或有部分编码能力并对爬虫技术有兴趣的读者,而且适合准备从事或学习数据科学与人工智能相关行业的读者。