Selenium定位元素的方法小结及语法详解_Python

以下是以百度网站为例，详细介绍 selenium 中各种定位元素方法的语法及使用场景：

1. 通过 id 定位

语法：使用 by.id 定位策略，在 python 代码里通过 find_element(by.id, 'element_id') 来定位元素，其中 element_id 是网页元素的 id 属性值。
使用场景：适用于元素具有唯一 id 属性的情况，定位准确且速度快。在百度搜索页面，搜索框的 id 通常是 kw ，可以使用该方法定位搜索框。

from selenium import webdriver
from selenium.webdriver.common.by import by

driver = webdriver.chrome()
driver.get('https://www.baidu.com')
search_box = driver.find_element(by.id, 'kw')

在这里插入图片描述

2. 通过 name 定位

语法：运用 by.name 定位策略，代码为 find_element(by.name, 'element_name')，element_name 是元素的 name 属性值。
使用场景：常用于表单元素，在百度搜索场景中，如果搜索框有 name 属性，就可以用这种方式定位。不过百度搜索框 name 也是 wd，与功能相关，方便表单提交数据。

driver.get('https://www.baidu.com')
search_box = driver.find_element(by.name, 'wd')

在这里插入图片描述

3. 通过 class name 定位

语法：采用 by.class_name 定位策略，代码是 find_element(by.class_name, 'element_class')，element_class 是元素的 class 属性值。
使用场景：当需要定位一组具有相同样式或功能的元素时使用。在百度搜索结果页面，每个搜索结果的标题可能有相同的 class 名，可借此定位所有标题元素。

driver.get('https://www.baidu.com/s?wd=python')
result_titles = driver.find_elements(by.class_name, 'cosc-title-slot') 
# 这里'cosc-title-slot' 需要替换为实际的 class 名

在这里插入图片描述

4. 通过 tag name 定位

语法：使用 by.tag_name 定位策略，代码为 find_element(by.tag_name, 'tag_name')，tag_name 是 html 标签名，像 div、input、a 等。
使用场景：可快速定位某一类标签元素，但通常会结合其他定位方法。例如在百度页面获取所有的链接元素（<a> 标签）。

driver.get('https://www.baidu.com')
links = driver.find_elements(by.tag_name, 'a')

5. 通过 link text 定位

语法：使用 by.link_text 定位策略，代码是 find_element(by.link_text, 'link_text')，link_text 是 <a> 标签的完整文本内容。
使用场景：专门用于定位链接元素，当知道链接的完整文本内容时使用。比如百度页面上可能有“新闻”链接。

driver.get('https://www.baidu.com')
news_link = driver.find_element(by.link_text, '新闻')

在这里插入图片描述

6. 通过 partial link text 定位

语法：使用 by.partial_link_text 定位策略，代码为 find_element(by.partial_link_text, 'partial_link_text')，partial_link_text 是 <a> 标签文本内容的一部分。
使用场景：当链接文本较长，只记得部分内容时适用。假设百度页面有个链接文本是“百度学术 - 权威学术资源平台”，只记得“百度学术”。

driver.get('https://www.baidu.com')
academic_link = driver.find_element(by.partial_link_text, '百度学术')

7. 通过 css selector 定位

语法：使用 by.css_selector 定位策略，代码是 find_element(by.css_selector, 'css_selector')，css_selector 是符合 css 选择器语法的表达式。
使用场景：css 选择器很灵活，可结合元素的标签名、类名、id、属性等进行定位。比如定位百度搜索按钮，它可能有特定的 class 和 type 属性。

driver.get('https://www.baidu.com')
search_button = driver.find_element(by.css_selector, 'input.some-class[type="submit"]') 
# 这里'some-class' 需要替换为实际的 class 名

8. 通过 xpath 定位

语法：使用 by.xpath 定位策略，代码为 find_element(by.xpath, 'xpath_expression')，xpath_expression 是符合 xpath 语法的表达式。
使用场景：xpath 是最强大的定位方式，能根据元素的属性、层级关系、文本内容等进行定位，适用于复杂的定位需求。例如定位百度搜索结果中第一个标题元素。

driver.get('https://www.baidu.com/s?wd=python')
first_result_title = driver.find_element(by.xpath, '//*[@id="1"]/div/div[1]/div[1]/h3/a[1]/em') 
# 这里的 xpath 要根据实际页面结构调整

在这里插入图片描述