爬虫_使用chromedriver.exe下载网页

本文介绍如何通过ChromeDriver结合Python的Selenium库来抓取指定网页的内容,并将页面源码保存为本地HTML文件。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

window10,pycharm

1. 查看电脑上Chrome浏览器版本

1.1 在Chrome浏览器地址栏中输入 chrome://version/

2. 下载 chromedriver.exe

2.1 下载地址  http://chromedriver.storage.googleapis.com/index.html

2.2 找到和自己安装的chrome对应的版本

 下载后解压,得到一个 chromedriver.exe 文件

3. 在 pycharm 中创建 python 项目

3.1 新建一个普通目录用于放置 chromedriver.exe

 3.2 新建一个.py文件

pre_dir = r'D:/temp/scrapy/'
driver = webdriver.Chrome('./driver/chromedriver.exe')
# 设置超时时间 10s
driver.set_page_load_timeout(10)
url_str = f"https://www.baidu.com"
driver.get(url_str)
page_source = driver.page_source
file_path = pre_dir + str(i)+'.html'
with open(file_path,'w',encoding='utf-8') as fw:
    fw.write(page_source)
driver.close()
driver.quit()

至此,使用 chromedriver.exe 下载网页的功能完毕

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值