
作者:方水平
页数:240
出版社:中国铁道出版社
出版日期:2023
ISBN:9787113303587
高清校对版pdf(带目录)
前往页尾底部查看PDF电子书
内容简介
本书以项目的形式讲授了静态网页数据的爬取和数据解析,抓取动态网页的数据并解析、利用Scrapy框架进行爬虫、爬取APP数据、模拟登录、代理爬虫等爬虫技术,教材以就业为导向,以能力为本位,为培养高素质技能型专业人才服务,同时教材对接1+X职业技能标准,是基于工作过程的形式开发完成的活页教材,依据“任务导向”“目标先行”、“兴趣诱发”的学习动机发展条件来进行的组织形式课程内容。. 本书可作为高职大数据相关专业的教材,也可以作为Python爬虫与数据采集相关教学和培训教材,也可作为相关技术人员的自学参考书。
作者简介
方水平,男,1970年2月生,教授,近几年主编了多部教材,多种图书被评为“十二五”“十三五”职业教育国家规划教材,主持多项信息化教学设计项目获得北京市二等奖。指导学生参加技能大赛获得良好的成绩,连续获得5个 职业院校学生技能大赛一等奖,被北京市教w授予“ 席指导教师称号”,2018年主持课题获北京市教育成果二等奖。
目录
项目一 静态网页爬取与解析
任务1 搭建静态网页爬虫环境
任务分析
导学
学习资料
1.爬虫基本概念
2.爬虫实现原理
3.静态网页爬虫环境搭建
任务实施
任务评价
任务2 爬取北京市旅游景点信息
任务分析
导学
学习资料
1.HTTP
2.网页组成
3.urllib库
4.Requests模块
任务实施
任务评价
任务3 解析并保存北京市旅游景点
数据
任务分析
导学
学习资料
1.正则表达式
2.使用XPath
3.Beautiful Soup库
任务实施
任务评价
项目二 爬取动态内容
任务1 安装Selenium
任务分析
导学
学习资料
任务实施
任务评价
任务2 利用Selerlium爬取京东商品信息数据
任务分析
导学
学习资料
1.Selenium简介
2.Selenium的应用
任务实施
任务评价
项目三 利用爬虫框架Scrapy爬虫
任务1 安装Scrapy框架
任务分析
导学
学习资料
1.Anaconda安装
2.Windows下的安装
任务实施
任务评价
任务2 利用Scrapy框架制作Spiders爬取网页数据
任务分析
导学
学习资料
1.Scrapy框架介绍
2.Scrapy的数据流
3.Scrapy常用命令
任务实施
任务评价
项目四 爬虫代理和模拟登录
任务1 爬虫代理
任务分析
导学
学习资料
1.代理基本原理
2.代理的作用
3.代理分类
4.Requests库使用IP代理的方法
5.构建代理池
任务实施
任务评价
任务2 模拟登录
任务分析
导学
学习资料
1.用户登录
2.Cookie
3.Session
4.JWT
5.基于Session和Cookie的模拟登录
6.基于Session和Cookie的模拟登录实例
任务实施
任务评价
项目五 App的爬取
任务1 App爬虫环境搭建
任务分析
导学
学习资料
1.App爬取的主要流程
2.Charles的安装
3.安装JAVA JDK
4.安装Android SDK Tools
5.Appium的安装
任务实施
任务评价
任务2 爬取微博主页推荐信息
任务分析
导学
学习资料
1.Charles简介
2.Appium简介
任务实施
任务评价
参考文献
任务1 搭建静态网页爬虫环境
任务分析
导学
学习资料
1.爬虫基本概念
2.爬虫实现原理
3.静态网页爬虫环境搭建
任务实施
任务评价
任务2 爬取北京市旅游景点信息
任务分析
导学
学习资料
1.HTTP
2.网页组成
3.urllib库
4.Requests模块
任务实施
任务评价
任务3 解析并保存北京市旅游景点
数据
任务分析
导学
学习资料
1.正则表达式
2.使用XPath
3.Beautiful Soup库
任务实施
任务评价
项目二 爬取动态内容
任务1 安装Selenium
任务分析
导学
学习资料
任务实施
任务评价
任务2 利用Selerlium爬取京东商品信息数据
任务分析
导学
学习资料
1.Selenium简介
2.Selenium的应用
任务实施
任务评价
项目三 利用爬虫框架Scrapy爬虫
任务1 安装Scrapy框架
任务分析
导学
学习资料
1.Anaconda安装
2.Windows下的安装
任务实施
任务评价
任务2 利用Scrapy框架制作Spiders爬取网页数据
任务分析
导学
学习资料
1.Scrapy框架介绍
2.Scrapy的数据流
3.Scrapy常用命令
任务实施
任务评价
项目四 爬虫代理和模拟登录
任务1 爬虫代理
任务分析
导学
学习资料
1.代理基本原理
2.代理的作用
3.代理分类
4.Requests库使用IP代理的方法
5.构建代理池
任务实施
任务评价
任务2 模拟登录
任务分析
导学
学习资料
1.用户登录
2.Cookie
3.Session
4.JWT
5.基于Session和Cookie的模拟登录
6.基于Session和Cookie的模拟登录实例
任务实施
任务评价
项目五 App的爬取
任务1 App爬虫环境搭建
任务分析
导学
学习资料
1.App爬取的主要流程
2.Charles的安装
3.安装JAVA JDK
4.安装Android SDK Tools
5.Appium的安装
任务实施
任务评价
任务2 爬取微博主页推荐信息
任务分析
导学
学习资料
1.Charles简介
2.Appium简介
任务实施
任务评价
参考文献
PDF更新中
- THE END -
非特殊说明,本博所有文章均为博主原创。
如若转载,请注明出处:https://www.xiazainiu.com/Wd1qk_5_13143.html