其他

XPathcontains()方法详解：灵活定位Web元素的利器

悠悠楠杉

2025-09-07

0 评论

138 阅读

正在检测是否收录...

09/07

本文深入讲解XPath中contains()函数的使用方法，通过实际案例展示其在元素定位中的灵活应用，帮助开发者解决动态属性、模糊匹配等常见难题。

在Web自动化和数据抓取领域，XPath就像一把瑞士军刀，而contains()函数则是其中最实用的功能之一。这个看似简单的方法，却能解决实际工作中的诸多棘手问题。

一、contains()基础语法解析

contains()属于XPath的字符串函数，其标准格式为：
xpath contains(字符串1, 字符串2)
当字符串1包含字符串2时返回true，否则返回false。例如要查找包含"登录"文本的按钮：
xpath //button[contains(text(),'登录')]

这种模糊匹配的特性，使其在以下场景特别有用：
- 元素文本部分匹配
- 动态变化的class或id属性
- 不确定完整属性值的情况

二、实际应用场景深度剖析

场景1：处理动态ID元素

现代前端框架常生成动态ID：html

...

使用精确匹配会失效，而contains能轻松应对：xpath
//div[contains(@id, 'user-') and contains(@id, '-profile')]

场景2：多语言网站定位

相同功能的按钮在不同语言版本中显示不同文本：
xpath //a[contains(@title, 'Delete') or contains(@title, '删除')]

场景3：表格数据提取

当需要提取包含特定关键词的表格行时：
xpath //tr[contains(td[2], '2023')]

三、高级使用技巧

组合使用多个contains：
xpath //input[contains(@class, 'form-control') and contains(@placeholder, '手机号')]
配合其他函数使用：
xpath //div[contains(translate(@class, 'ABCDEFGHIJKLMNOPQRSTUVWXYZ', 'abcdefghijklmnopqrstuvwxyz'), 'dropdown')]
性能优化建议：

- 尽量在contains前添加标签名缩小范围
- 避免在大型文档中使用//开头的绝对路径

四、实战案例演示

假设我们需要抓取电商网站的商品信息，但发现商品卡片的class属性包含随机字符串：

html

...

解决方案：
xpath //div[contains(@class, 'product-card')]//h3

对于分页导航按钮的定位：
xpath //a[contains(@href, 'page=') and not(contains(@class, 'disabled'))]

五、常见问题解决方案

问题1：当元素同时包含多个关键词时如何定位？
方案：
xpath //*[contains(., '欢迎') and contains(., '回来')]

问题2：如何避免匹配到不相关的父元素？
方案：添加更精确的层级限制
xpath //ul[@class='menu']/li[contains(a, '首页')]

问题3：contains默认区分大小写怎么办？
方案：结合translate()函数转换大小写

六、与其他定位方式的对比

相比精确定位，contains()的优势在于：
- 更好的适应性
- 更简洁的表达式
- 更高的可维护性

但需要注意：
- 可能匹配到多个元素
- 性能略低于精确匹配
- 需要更严谨的测试验证

朗读

版权属于：

至尊技术网

本文链接：

https://www.zzwws.cn/archives/37972/（转载时请注明本文出处及文章链接）

作品采用：

《署名-非商业性使用-相同方式共享 4.0 国际 (CC BY-NC-SA 4.0)》许可协议授权