
python爬虫
山河长不高吖
一个梦想成为大牛的小白!
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
4 fiddler抓包
fiddler4抓包和夜神模拟器1 HTTP代理利用socket开发一个简易版HTTP代理服务器import socketimport re"""利用socket搭建一个建议的HTTP代理"""server = socket.socket() # 创建服务端server.bind(('0.0.0.0', 8181))server.listen(5) # 监听cli...原创 2019-10-24 14:32:13 · 614 阅读 · 0 评论 -
3 Requests
3 Requests1 请求1.1 发起网络请求GET请求:import requests# GET请求response_get = requests.get('http://www.baidu.com')char_data = response_get.text # 字符串响应数据binary_data = response_get.content # 二进制响应数据#...原创 2019-10-24 14:30:10 · 213 阅读 · 0 评论 -
urllib和urllib3
爬虫基础1 爬虫概念1.1 爬虫的概念网络爬虫也叫网络蜘蛛,它特指一类自动批量下载网络资源的程序,这是一个比较口语化的定义。更加专业和全面对的定义是:网络爬虫是伪装成客户端与服务端进行数据交互的程序。1.2 爬虫的应用数据采集大数据时代来临,数据就是核心,数据就是生产力,越来越多的企业开始注重收集用户数据,而爬虫技术是收集数据的一种重要手段。搜索引擎百度,谷歌等搜索引擎都是基于...原创 2019-10-24 14:29:11 · 500 阅读 · 0 评论 -
HTTP和HTTPS协议
文章目录1 概述2 HTTP2.1 HTTP请求流程2.2 URL2.3 HTTP请求报文2.4 HTTP请求方法2.5 HTTP请求报头2.6 HTTP请求正文2.7 HTTP响应报文2.8 HTTP响应状态码2.9 HTTP响应报头2.10 HTTP协议的特点3 HTTPS协议4 当输入url时到页面显示过程中浏览器做了哪些事1 概述目前几乎所有的商业应用都是基于互联网的,它们一般采用c/...原创 2019-10-12 15:04:54 · 486 阅读 · 0 评论