用 Python 写网络爬虫(第2版)

作者: [德]凯瑟琳·雅姆尔(Katharine·Jarmul)/[澳]理查德·劳森(Richard·Lawson) | 译者: 李斌
 评分: 6.7   分类: 爬虫 

本书包括网络爬虫的定义以及如何爬取网站,如何使用几种库从网页中抽取数据,如何通过缓存结果避免重复下载的问题,如何通过并行下载来加速数据抓取,如何利用不同的方式从动态网站中抽取数据,如何使用叔叔及导航等表达进行搜索和登录,如何访问被验证码图像保护的数据,如何使用 Scrapy 爬虫框架进行快速的并行抓取,以及使用 Portia 的 Web 界面构建网路爬虫。

出版社: 人民邮电出版社
豆瓣链接: 点击访问
出版年: 2018-7-22
资源提供: root
页数: 200
文件大小: 12.63MB
ISBN: 9787115479679
下载次数: 25

Copyright © 2024.Copyright Itbox All Rights Reserved.
免责声明:本站所有的书籍资源皆收集于互联网,仅供学习交流,严禁用于商业用途,并请于下载后24小时内删除。 若发布的内容侵犯到您的权益,请及时联系邮箱mcystory@126.com,我们将在第一时间处理。