
Python爬虫之路
IT__LS
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
python request库安装
今天刚入门学到了requests库,在命令行打pip install requests结果出现了原来是在scripts下才能运行原创 2017-09-02 15:54:21 · 1339 阅读 · 0 评论 -
urilib2检验代理IP
爬虫笔记---IP代理检验#!/usr/bin/env python#-*- coding: utf-8 -*-import urllib2import sysimport redef testArgument(): '''测试输入测试IP地址,只需要一个参数 ''' if len(sys.argv) != 2: print(u'只需要一个参数就够了') tipUse()...原创 2018-03-09 23:31:04 · 300 阅读 · 0 评论 -
爬虫-urllib2-Headers (常用)
爬虫---学习笔记爬虫请求网站时要模拟浏览器,这就要用到User-Agent#PC端UserAgent = {"safari 5.1 – MAC":"User-Agent:Mozilla/5.0 (Macintosh; U; Intel Mac OS X 10_6_8; en-us) AppleWebKit/534.50 (KHTML, like Gecko) Version/5原创 2017-12-23 16:55:11 · 1244 阅读 · 0 评论 -
IP正则匹配
参考:http://www.cnblogs.com/loveyoume/archive/2016/12/25/6220275.html http://www.cnblogs.com/kongxianghai/p/3995463.html http://www.cnblogs.com/olive987/p/5844501.htmlIP转载 2017-11-01 21:07:24 · 502 阅读 · 0 评论 -
网易云热门歌曲歌单爬虫
python刚入门来秀一小下。。。哈哈,大佬请绕路啊,当然也可以指点指点。。。。。原创 2017-10-13 21:44:02 · 3157 阅读 · 0 评论 -
PY 爬虫 Urllib2
版本是python2.7,3.x的版本urllib与urllib2已经合并为一个urllib库,学着比较清晰些,2.7的版本呢urllib与urllib2各有各的作用urllib2可以接受一个Request对象,并以此可以来设置一个URL的headers1.urlopen方法也可通过建立了一个Request对象来明确指明想要获取的url。调用urlopen函数对请求的u转载 2017-10-13 19:37:17 · 495 阅读 · 0 评论 -
python 爬虫 基本抓取
首先,Python中自带urllib及urllib2这两个模块,基本上能满足一般的页面抓取,另外,requests也是非常有用的。Requests: import requests response = requests.get(url) content = requests.get(url).content print "response headers:", response.转载 2017-10-18 17:14:46 · 350 阅读 · 0 评论 -
python json文件
JSON(JavaScript Object Notation, JS 对象标记) 是一种轻量级的数据交换格式。它基于ECMAScript (w3c制定的js规范)的一个子集,采用完全独立于编程语言的文本格式来存储和表示数据。简洁和清晰的层次结构使得 JSON 成为理想的数据交换语言。 易于人阅读和编写,同时也易于机器解析和生成,并有效地提升网络传输效率。JSON 键/值对转载 2017-10-15 20:17:16 · 763 阅读 · 0 评论