selenium爬取天眼查

### 天眼查数据爬取实现要通过 Selenium 抓取天眼查上的数据，可以按照以下方法构建代码逻辑： #### 导入必要的模块首先需要导入 `selenium` 的核心模块以及辅助工具来完成操作。 ```python from selenium import webdriver from selenium.webdriver.common.by import By from selenium.webdriver.common.keys import Keys import time ``` 上述代码片段展示了如何引入 WebDriver 和其他常用功能模块[^1]。这些模块用于初始化浏览器驱动程序并提供定位页面元素的能力。 #### 初始化 WebDriver 为了启动浏览器实例，需指定使用的浏览器类型及其路径（如果未设置环境变量）。这里以 Chrome 浏览器为例说明配置过程。 ```python options = webdriver.ChromeOptions() driver = webdriver.Chrome(options=options, executable_path='/path/to/chromedriver') ``` 此部分定义了一个新的 ChromeDriver 实例，并允许传递自定义选项参数给它[^2]。注意替换 `/path/to/chromedriver` 为你本地 chromedriver 文件的实际位置。 #### 执行登录流程访问目标站点后输入用户名密码提交表单即可完成身份验证动作。 ```python url = 'https://www.tianyancha.com/login' driver.get(url) username_input = driver.find_element(By.ID, "mobile") password_input = driver.find_element(By.ID, "password") username_input.send_keys('your_username') # 替换为实际账号名 password_input.send_keys('your_password') # 替换为真实密码值 login_button = driver.find_element(By.XPATH, "//button[@type='submit']") login_button.click() time.sleep(5) # 等待加载完毕再继续下一步骤 ``` 上面脚本实现了打开登录页填写资料点击按钮的过程[^3]。其中利用了 XPath 表达式精确定位到特定 HTML 节点上执行交互行为。 #### 数据采集阶段成功进入个人中心或其他授权区域之后就可以开始提取所需字段啦！ ```python search_box = driver.find_element(By.NAME, "key") search_box.clear() # 清空原有内容以防干扰测试结果准确性 search_box.send_keys("阿里巴巴集团控股有限公司") search_box.submit() companies_listings = [] for company in range(len(driver.find_elements(By.CLASS_NAME,"result-list"))): companies_dict={} name=driver.find_element(By.CSS_SELECTOR,f".company:nth-child({str(company+1)}) .name").text.strip() legal_representative=driver.find_element(By.CSS_SELECTOR,f".company:nth-child({str(company+1)}) td[data-title='法定代表人']").text.strip() registered_capital=driver.find_element(By.CSS_SELECTOR,f".company:nth-child({str(company+1)}) td[data-title='注册资本']").text.strip() establishment_date=driver.find_element(By.CSS_SELECTOR,f".company:nth-child({str(company+1)}) td[data-title='成立日期']").text.strip() companies_dict['Name']=name companies_dict['Legal Representative']=legal_representative companies_dict['Registered Capital']=registered_capital companies_dict['Establishment Date']=establishment_date companies_listings.append(companies_dict) print(companies_listings) ``` 该段落描述的是搜索框内键入关键词触发查询返回列表解析获取每条记录详情的操作方式。采用 CSS Selectors 方法快速匹配多个同级标签下的子节点属性读取出来存放到字典对象里最后形成数组集合形式输出查看效果。 #### 关闭会话资源释放当所有任务完成后记得关闭当前窗口销毁进程以免占用过多系统内存空间造成性能下降等问题发生。 ```python driver.quit() ``` 以上即完成了整个基于 Python 编程语言配合 Selenium 库自动化处理网页浏览活动从而达到批量收集公开商业情报的目的。 ---

阅读全文

selenium爬取天眼查

相关推荐

基于Selenium爬取天眼查数据资料齐全+详细文档+高分项目+源码.zip

基于selenium模拟天眼查登录并爬取企业注册等信息的爬虫

基于selenium模拟天眼查登录并爬取企业工商信息的python爬虫

基于selenium模拟天眼查登录并爬取企业工商信息的爬虫

python爬取天眼查吊销数据

使用Python和Selenium模拟登录天眼查爬取企业信息方法

Selenium 天眼查

给定公司名称excel列表在天眼查搜索爬取企业工商信息.pdf

基于Python的天眼查爬虫-下载即用-爬取完整的公司数据（可爬需要VIP才能用的邮箱和电话等）

天眼查公司数据抓取 自动登陆 跳转抓取 翻页 写入数据库

天眼查数据抓取 自动登陆 跳转抓取 翻页 写入数据库.zip

爬虫从入门到精通,内含如何应对反爬的独家经验.知乎,拉勾,天眼查

(Win10) 使用 Selenium + Python + Chrome 爬取数据并存入 MySQL 的尝试-附件资源

北京工商企业信息查询页面抓取

Python爬虫模拟登录天眼查并爬取企业信息教程

自动化天眼查公司数据爬取及数据库写入方法

天眼查爬虫

python抓取天眼查数据

【Java使用配置文件连接mysql】

大家在看

基于STM32 HAL库的 AD7606驱动代码及相关文档

群晖，威联通5G USB网卡驱动，918+使用

瑞星卡卡kaka小狮子（不含杀软） For Mac，情怀小程序，有动画有声，亲测可用

北邮计算机网络滑动窗口实验报告（附页包含源程序）

ENVI遥感图像几何校正 包含练习数据

最新推荐

Python selenium爬取微信公众号文章代码详解

结合scrapy和selenium爬推特的爬虫总结

【Java使用配置文件连接mysql】

获取本机IP地址的程序源码分析

【权威指南】：Win11笔记本上RTX4080驱动的安装与调试秘籍

windows环境举例

QQ自动发送/回复系统源代码开放

【7步打造Win11深度学习利器】：Tensorflow-GPU与RTX4080终极优化指南

ue画笔画画蓝图版

VB.NET图表曲线组件实现多种图表绘制

天眼查公司数据抓取自动登陆跳转抓取翻页写入数据库

天眼查数据抓取自动登陆跳转抓取翻页写入数据库.zip

ENVI遥感图像几何校正包含练习数据