news 2026/4/15 11:12:51

掌握web控件定位技巧,提升页面操作效率

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
掌握web控件定位技巧,提升页面操作效率

在做 Web 自动化时,最根本的就是操作页面上的元素,首先要能找到这些元素,然后才能操作这些元素。工具或代码无法像测试人员一样用肉眼来分辨页面上的元素。那么要如何定位到这些元素,本章会介绍各种定位元素的方法。

web 控件定位
id 定位

Python 实现

driver.find_element(By.ID,'query')

Java 实现

driver.findElement(By.id("query"));
name 定位

Python 实现

driver.find_element(By.NAME,'query')

Java 实现

driver.findElement(By.name("query"));

通常来说 name 属性与 id 属性在页面中唯一,推荐使用这两个属性进行定位。

XPath 定位

XPath 是一个定位语言,英文全称为:XML Path Language,用来对 XML 上的元素进行定位,但也适用于 HTML,下面来看一个例子。

要定位的元素是 Sogou 首页的搜索输入框。

首先寻找 id 为 sf 的 form 元素,然后再寻找它的子元素 span,span 的 class 属性为sec-input-box,最后找 span 的子元素 input,以下代码演示。

Python 实现

driver.find_element(By.XPATH,"//form[@id='sf']/span[@class='sec-input-box']/input")

Java 实现

driver.findElement(By.xpath("//form[@id='sf']/span[@class='sec-input-box']/input"));

下面的定位也可以找到这个 input,请注意,这里使用了双斜杠//,它可以找到子孙节点,而但斜杠/只能找到子节点,以下代码演示。

Python 实现

driver.find_element(By.XPATH,"//form[@id='sf']//input[@id='query']")

Java 实现

driver.findElement(By.xpath("//form[@id='sf']//input[@id='query']"));

XPath 表达式更多内容可参考下面表格。

表达式描述
nodename选取此节点的所有子节点。
/从根节点选取。
//从匹配选择的当前节点选择文档中的节点,而不考虑它们的位置。
.选取当前节点。
..选取当前节点的父节点。
@选取属性。

如何检验 XPath 定位是否正确?可以使用 chrome 的检查模式 -> Console,输入$x('XPath 表达式')即可。

通过 css_selector

XPath 可以定位绝大多数元素,但是 XPath 采用从上到下的遍历模式,速度并不快,而 css selector 采用样式定位,速度要优于 XPath,而且语法更简洁。下面是 Selenium 使用 css selector 的例子。

css selector 找到 class 属性值为 active 的元素,然后>表示找 class 属性为 active 的元素的子节点,以下代码演示。

Python 实现

driver.driver.find_element(By.CSS_SELECTOR,'.logo-big')

Java 实现

driver.findElement(By.cssSelector(".logo-big"));

下表列出了常用的 css_selector 表达式的用法。

表达式描述
.introclass="intro" 的所有元素
#firstnameid="firstname" 的所有元素
a[target=_blank]具有属性 target="_blank" 的所有 a 元素
p:nth-child(2)属于其父元素的第二个 p 元素

使用 Chrome 的检查模式 -> Console 也可以在当前页面检测 css_selector 是否正确,输入$('css selector 表达式')即可。

link 定位

元素中会出现文字,比如下面的分类,可以利用这段文字进行定位,以下是代码演示。

Python 实现

driver.driver.find_element(By.LINK_TEXT, '欢迎光临测试人社区 | Powered by 霍格沃兹测试开发学社')

Java 实现

driver.findElement(By.linkText("欢迎光临测试人社区 | Powered by 霍格沃兹测试开发学社"));

也可以采用部分匹配方式,不必写全:“欢迎光临”、“欢迎光临测试人社区”、“霍格沃兹”,以下是代码演示。

Python 实现

driver.find_element(By.PARTIAL_LINK_TEXT, '测试人社区')

Java 实现

driver.findElement(By.partialLinkText("测试人社区"));

要注意 partial_link_text 与 link_text 的区别,partial_link_text 不用写全,只需写部分即可,比如上面使用“霍格沃兹”即可匹配到“欢迎光临霍格沃兹测试学院”。

tag_name 定位

DOM 结构中,元素都有自己的 tag,比如 input tag,button tag,anchor tag 等等,每一个 tag 拥有多个属性,比如 id,name,value class 等等。

下面的高亮部分就是 tag:

可以使用 tag 进行定位:

Python 实现

driver.driver.find_element(By.TAG_NAME,'input')

Java 实现

driver.findElement(By.tagName("input"));

要注意,尽量避免使用 tag_name 定位元素,因为有大量重复的元素!

class_name 定位

可以通过元素的 class 属性值进行定位。

这里的 active 用的就是上图 class 的值。

Python 实现

driver.driver.find_element(By.CLASS_NAME, 'active')

Java 实现

driver.findElement(By.className("active"));
推荐使用

  1. ID/Name 是最安全的定位选项。根据 W3C 标准,它在页面中是唯一的,ID 在树结构中也是唯一的。

  2. CSS Selector 语法简洁,搜索速度快于 XPath。

  3. XPath 定位功能强大,采用遍历搜索,速度略慢。

  4. link,class name, tag name:不推荐使用,无法精准定位。

常见操作

Selenium 常见操作有:

  1. 输入、点击、清除。

  2. 关闭窗口、浏览器。

  3. 获取元素属性。

  4. 获取网页源代码、刷新页面。

  5. 设置窗口大小。

输入、点击、清除

输入、点击、清除在 Selenium 中对应的方法分别是 send_keys、click、clear。

Python 实现

  1. from selenium import webdriver

  2. driver = webdriver.Chrome()

  3. driver.get('http://www.baidu.com')

  4. driver.find_element(By.NAME,'wd').send_keys('XXXX')

  5. driver.find_element(By.ID,'su').click()

  6. driver.find_element(By.NAME,'wd').clear()

Java 实现

  1. importorg.openqa.selenium.By;

  2. importorg.openqa.selenium.WebDriver;

  3. importorg.openqa.selenium.chrome.ChromeDriver;

  4. publicclass demo2{

  5. publicstaticvoidmain(String[]args)throwsInterruptedException{

  6. WebDriverdriver=newChromeDriver();

  7. driver.get("http://www.baidu.com'");

  8. Thread.sleep(2000);

  9. driver.findElement(By.name("wd")).sendKeys("霍格沃兹测试学院");

  10. driver.findElement(By.id("su")).click();

  11. driver.findElement(By.name("wd")).clear();

  12. //关闭浏览器进程

  13. driver.quit();

  14. }

  15. }

关闭窗口、浏览器

关闭当前句柄窗口(不关闭进程)close(),关闭整个浏览器进程quit()

Python 实现

  1. #导入对应的依赖

  2. from selenium import webdriver

  3. #初始化webdriver

  4. driver = webdriver.Chrome()

  5. #访问网站

  6. driver.get('http"//www.baidu.com')

  7. #关闭当前窗口

  8. driver.close()

  9. #关闭浏览器

  10. driver.quit()

Java 实现​​​​​​​

  1. importorg.openqa.selenium.WebDriver;

  2. importorg.openqa.selenium.chrome.ChromeDriver;

  3. publicclass demo{

  4. publicstaticvoidmain(String[]args)throwsInterruptedException{

  5. WebDriverdriver=newChromeDriver();

  6. driver.get("https://ceshiren.com");

  7. Thread.sleep(2000);

  8. //关闭页面

  9. driver.close();

  10. Thread.sleep(2000);

  11. //关闭浏览器进程

  12. driver.quit();

  13. }

  14. }

获取元素属性

获取元素标签上的属性 get_attribute('value'),元素的坐标 location,元素的大小 size。

Python 实现​​​​​​​

  1. import logging

  2. from selenium import webdriver

  3. def test_baidu():

  4. driver = webdriver.Chrome()

  5. driver.get('https://www.baidu.com')

  6. search = driver.find_element(By.ID,'su')

  7. logging.basicConfig(level=logging.INFO)

  8. logging.info(search.get_attribute('value'))

  9. #获取search的value属性值并打印

  10. logging.info(search.get_attribute('value'))

  11. #打印search的位置坐标

  12. logging.info(search.location)

  13. #打印search的元素大小

  14. logging.info(search.size)

Java 实现​​​​​​​

  1. importorg.openqa.selenium.*;

  2. importorg.openqa.selenium.chrome.ChromeDriver;

  3. importjava.util.logging.Logger;

  4. publicclass demo{

  5. privatestaticfinalLoggerlogger=Logger.getLogger(demo.class.getName());

  6. publicstaticvoidmain(String[]args)throwsInterruptedException{

  7. WebDriverdriver=newChromeDriver();

  8. driver.get("https://www.baidu.com");

  9. Thread.sleep(2000);

  10. WebElementsearch=driver.findElement(By.id("su"));

  11. //获取search元素的value属性值并打印

  12. logger.info(search.getAttribute("value"));

  13. //获取search元素的位置坐标值并打印

  14. Pointp=search.getLocation();

  15. logger.info("Width: "+p.x);

  16. logger.info("Height: "+p.y);

  17. //获取search元素的大小并分别打印

  18. Dimensionsize=search.getSize();

  19. intwidth=size.getWidth();

  20. intheight=size.getHeight();

  21. logger.info("Width: "+width);

  22. logger.info("Height: "+height);

  23. driver.close();

  24. //关闭浏览器进程

  25. driver.quit();

  26. }

  27. }

输出结果为:​​​​​​​

  1. INFO:root:百度一下

  2. INFO:root:百度一下

  3. INFO:root:{'x':844,'y':188}

  4. INFO:root:{'height':44,'width':108}

获取网页源代码、刷新页面

网页源代码 page_source,刷新页面 refresh()。

Python 实现​​​​​​​

  1. import logging

  2. from selenium import webdriver

  3. driver = webdriver.Chrome()

  4. driver.get('http"//www.baidu.com')

  5. #刷新页面

  6. driver.refresh()

  7. logging.basicConfig(level=logging.INFO)

  8. #打印当前页面的源代码

  9. logging.info(driver.page_source)

Java 实现​​​​​​​

  1. importorg.openqa.selenium.*;

  2. importorg.openqa.selenium.chrome.ChromeDriver;

  3. importjava.util.logging.Logger;

  4. publicclass demo{

  5. privatestaticfinalLoggerlogger=Logger.getLogger(demo.class.getName());

  6. publicstaticvoidmain(String[]args)throwsInterruptedException{

  7. WebDriverdriver=newChromeDriver();

  8. driver.get("https://ceshiren.com");

  9. Thread.sleep(2000);

  10. driver.navigate().refresh();

  11. //打印页面源代码

  12. logger.info(driver.getPageSource());

  13. driver.close();

  14. //关闭浏览器进程

  15. driver.quit();

  16. }

  17. }

设置窗口大小

设置窗口大小主要有最小化、最大化和自定义设置窗口具体的大小。

Python 实现​​​​​​​

  1. from selenium import webdriver

  2. driver = webdriver.Chrome()

  3. driver.get('http"//www.baidu.com')

  4. #最小化窗口

  5. driver.minimize_window()

  6. #最大化窗口

  7. driver.maximize_window()

  8. #将浏览器设置为1000*1000的大小

  9. driver.set_window_size(1000, 1000)

Java 实现​​​​​​​

  1. importorg.openqa.selenium.*;

  2. importorg.openqa.selenium.chrome.ChromeDriver;

  3. publicclass demo{

  4. publicstaticvoidmain(String[]args)throwsInterruptedException{

  5. WebDriverdriver=newChromeDriver();

  6. driver.get("https://ceshiren.com");

  7. //最大化页面

  8. driver.manage().window().maximize();

  9. //最小化页面

  10. driver.manage().window().minimize();

  11. Thread.sleep(2000);

  12. //将浏览器页面大小设置为800x600像素

  13. driver.manage().window().setSize(newDimension(800,600));

  14. driver.close();

  15. //关闭浏览器进程

  16. driver.quit();

  17. }

  18. }

感谢每一个认真阅读我文章的人,礼尚往来总是要有的,虽然不是什么很值钱的东西,如果你用得到的话可以直接拿走:

这些资料,对于【软件测试】的朋友来说应该是最全面最完整的备战仓库,这个仓库也陪伴上万个测试工程师们走过最艰难的路程,希望也能帮助到你!有需要的小伙伴可以点击下方小卡片领取

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/14 4:23:52

洗衣液哪些牌子好?洗衣液哪类品牌比较好用?

洗衣液哪些牌子好?洗衣液哪类品牌比较好用? 面对超市货架上琳琅满目的洗衣液品牌,以及电商平台里五花八门的产品分类,很多消费者都会陷入选择困境:到底选哪个牌子才能洗得干净又不伤衣?贵的就一定好用吗&am…

作者头像 李华
网站建设 2026/4/14 2:26:20

你的论文正被“大数据巡逻队”锁定:如何让AIGC痕迹瞬间隐身?

这是2025年学术圈的新常态——论文不仅要过“查重关”,还要过“AIGC检测关”。随着高校和期刊普遍部署专业系统识别AI生成文本,学术写作进入了“双轨制审核”时代。 你可能会发现,辛辛苦苦用AI辅助完成的论文,在常规查重中表现良…

作者头像 李华
网站建设 2026/4/14 23:09:18

在Blazor项目里构造一个覆盖面广泛的权限组件

前言 之前笔者写过一篇推广Blazor的博客《安利一下Blazor:.NET开发者的全栈“优”选项》,简单的聊过一点Blazor的话题,以及它和一些前端框架(如Vue,React)的异曲同工之处。 近期在开发的一个基于Blazor S…

作者头像 李华
网站建设 2026/4/14 3:26:58

FaceFusion人脸替换可用于文化遗产活化再现

FaceFusion人脸替换可用于文化遗产活化再现 在敦煌莫高窟的一幅唐代壁画前,一位游客举起手机扫描二维码——刹那间,画中身着华服的供养人缓缓转头,微笑着开口讲述千年前开凿石窟的故事。这不是科幻电影场景,而是借助AI技术正在实现…

作者头像 李华
网站建设 2026/4/15 4:27:07

出售前如何擦除iPhone数据?9个技巧与3种简单解决方案

iPhone的使用寿命很长,如果保养得当,通常可达10年。但由于苹果频繁更新设备,大多数用户每3年就会通过出售旧设备来升级。然而,在出售之前,采取一些步骤以避免潜在问题是非常重要的。本文将介绍如何在出售前擦除iPhone数…

作者头像 李华
网站建设 2026/4/12 18:43:11

收藏!35岁程序员转型大模型全攻略:凭技术积淀破局,平稳衔接新赛道

35岁,是程序员职业道路上的一道“分水岭”——传统开发岗位的年龄限制、重复劳动的职业倦怠、技术迭代的焦虑感,让不少人陷入“转型无门、坚守乏力”的困境。而大模型浪潮的席卷,恰好为有多年技术积淀的程序员打开了新天窗:你的编…

作者头像 李华