- 博客(4)
- 收藏
- 关注
原创 python爬虫入门(二) HTML基础
HTML概念HTML(Hyper Text Markup Language)是用来描述网页的一种语言,也叫超文本标记语言HTML文档就是前端工程师设计网页时使用的语言,浏览器会根据HTML文档的描述,解析出它所描述的网页。查看网页HTML代码Windows系统的电脑:使用快捷键ctrl+u来查看网页源代码在网页的空白处点击右键,然后选择“检查”(快捷方式:ctrl+shift+i)...
2020-02-18 13:25:39
522
原创 python爬虫入门(一)
浏览器的工作原理:客户端、浏览器、服务器之间的关系如上图爬虫的工作原理获取数据:根据我们提供的网址,向服务器发起请求,然后返回数据。解析数据:爬虫程序会把服务器返回的数据解析成我们能读懂的格式。提取数据:爬虫程序再从中提取出我们需要的数据。储存数据:爬虫程序把这些有用的数据保存起来,便于你日后的使用和分析。入门第一步【requests库】我们将会利用一个强大的库——reque...
2020-02-17 13:45:31
391
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人