Python Selenium使用
目录
第一章、安装篇
1、安装selenium三方插件包
pip install selenium
2、安装webdriver
视情况在选择各大浏览器驱动,附谷歌浏览器驱动型下载地址https://chromedriver.storage.googleapis.com/index.html,注意:一定要下载与所安装的浏览器版本一致。
3、配置驱动文件的环境变量
以win10举例 此电脑–>属性–>高级系统设置–>环境变量–>系统变量–>Path–>增加驱动包的路径
第二章、Selenium-元素定位篇
1、定位方式
ID、NAME、CLASS_NAME、TAG_NAME、LINK_TEXT、
PARTIAL_LINK_TEXT、XPATH、CSS_SELECTOR
2、具体定位示例及说明
1、通过ID、CLASS_NAME定位
driver.find_element_by_id(“app”) 或
driver.find_element(By.ID, “app”)
driver.find_element_by_class_name(“basic”) 或
driver.find_element(By. CLASS_NAME, “basic”)
注意:当class name 有多个class组成时,例如 class = “menu-list level1-menu-list level2-menu-list”, 先把class name按空格分隔,然后取其中一个即可,不分割直接输入会发生报错
2、通过NAME定位
driver.find_element_by_name(“wd”) 或
driver.find_element(By. NAME, “wd”)
3、通过TAG_NAME定位
标签定位法,例如<a>、 <input>、 <div>等等
driver.find_element_by_name(“input”) 或
driver.find_element(By. TAG_NAME, “input”)
4、通过LINK_TEXT
超链接标签精确定位,例如<a href="url">超链接载体名</a>
定位百度搜索主页 贴吧 超链接
driver. find_element_by_link_text(“贴吧”) 或
driver.find_element(By. LINK_TEXT, “贴吧”)
5、通过PARTIAL_LINK_TEXT
超链接标签模糊定位,例如<a href="url">超链接载体名</a>
定位百度搜索主页 贴吧 超链接
driver. find_element_by_link_text(“贴”) 或
driver.find_element(By. LINK_TEXT, “贴”)
6、通过XPATH(个人喜欢该方式定位元素)
标签的相对路径或者绝对路径定位
driver. find_element_by_xpath(“'//*[@id="normal_login_account"]'”) 或
driver.find_element(By. XPATH, “'//*[@id="normal_login_account"]'”)
drive. find_elements(By.XPATH, "./ul/li")
7、通过CSS_SELECTOR
CSS选择器定位
driver.find_element_by_css_selector("#span > div > div")或
driver.find_element(By.CSS_SELECTOR, "#span > div > div ")
实际场景中,会结合上面8中定位方式混合使用,因地制宜