其他

Xpath语法格式总结，xpath 语法

悠悠楠杉

2025-06-14

0 评论

130 阅读

正在检测是否收录...

06/14

在数据抓取和XML解析领域，XPath就像GPS导航系统，它能精准定位文档中的每个节点。作为W3C标准语言，XPath通过路径表达式在XML/HTML文档中导航，无论是网页爬虫开发还是配置文件解析都离不开它。

xpath //div # 选择所有div元素 /bookstore # 选择根元素bookstore text() # 选取文本节点
就像文件系统的目录树，/表示从根开始，//表示全局搜索，两者配合能快速锁定目标区域。

xpath //@lang # 选择所有lang属性 //a[@href] # 带href属性的a标签
属性定位是XPath的精准武器，特别是处理动态生成的元素时，像@class='btn-primary'这样的表达式比CSS选择器更灵活。

xpath //li[position()<3] # 前两个li元素 //input[contains(@name,'user')] # name含user的输入框
当需要处理表格数据时，[position()]和[last()]这类函数能实现智能分页抓取。

xpath /div/child::span # div的直接子span //a/following::div[1] # a标签后第一个同级div
轴选择就像三维定位，ancestor、descendant等轴可以穿透文档层级，特别适合处理嵌套复杂的电商网站页面。

网页抓取：结合Scrapy等框架使用
python response.xpath('//h1/text()').get()
自动化测试：Selenium元素定位
java driver.findElement(By.xpath("//button[text()='提交']"))
配置文件解析：处理Spring等XML配置时快速定位Bean定义