前言
虽然python爬虫方便,但是php在这方面也不弱,谁让php是世界上最好的语言!这里推荐一款php的爬虫框架phpspider。不建议自己写爬虫,因为效率太低。使用框架爬虫真的要高效许多
官方文档:
https://doc.phpspider.org/
1、下载
官方github下载地址:
https://github.com/owner888/phpspider
下载地址可能无法访问,这里提供一个网盘下载地址:
https://pan.baidu.com/s/10n9ZOUQBlrJzOQx0ShOmMQ
提取码:b2zc
2、文件结构
下载解压后,phpspider的文件结构如图所示:
其中demo文件夹放的是phpspider的一些案例,如图所示:
3、创建爬虫并且运行
在demo文件夹下创建爬虫文件。需要注意的是,phpspider有两种运行爬虫文件的方式,一种是在命令行下运行;另外一种是可视化操作(在浏览器下运行)
3.1 在命令行下运行爬虫文件
要爬取的对象链接:
https://www.douban.com/photos/a