其他

Python如何实现网页截图？selenium使用教程详解

悠悠楠杉

2025-07-09

0 评论

90 阅读

正在检测是否收录...

07/09

一、为什么需要网页截图？

在自动化测试、数据采集或网页监控场景中，网页截图是验证页面状态的核心手段。相比手动操作，Python结合selenium可以实现：
- 定时批量截图存档
- 自动化测试失败时保留现场证据
- 动态内容（如广告弹窗）的捕获

二、环境准备

1. 安装必要库

bash pip install selenium pillow # pillow用于后期图像处理

2. 下载浏览器驱动

selenium需要对应浏览器的驱动程序：
- Chrome用户下载chromedriver
- Firefox用户下载geckodriver

将解压后的驱动文件放入系统PATH目录（如/usr/local/bin）

三、基础截图代码实现

python
from selenium import webdriver
from time import sleep

def capturescreenshot(url, savepath):
# 创建无头浏览器选项（不显示GUI）
options = webdriver.ChromeOptions()
options.add_argument("--headless")

driver = webdriver.Chrome(options=options)
try:
    driver.get(url)
    sleep(2)  # 等待页面加载

    # 核心截图方法
    driver.save_screenshot(save_path)
    print(f"截图已保存至：{save_path}")
finally:
    driver.quit()

示例使用

capture_screenshot("https://www.baidu.com", "baidu.png")

代码解析：
1. --headless参数让浏览器在后台运行
2. sleep(2)确保页面完全加载
3. save_screenshot()支持PNG/JPEG格式

四、高级技巧实战

1. 截取特定元素

python element = driver.find_element("id", "kw") # 百度搜索框 element.screenshot("search_box.png")

2. 全页截图（解决滚动页问题）

python

获取页面总高度

totalheight = driver.executescript("return document.body.scrollHeight")
driver.setwindowsize(1920, totalheight) # 调整窗口高度 driver.savescreenshot("full_page.png")

3. 处理Cookie弹窗

python try: driver.find_element("css selector", ".cookie-btn").click() except: print("未发现Cookie弹窗")

五、常见问题解决

1. 截图出现空白页

原因：页面未完全加载
解决方案：python
from selenium.webdriver.support.wait import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC

wait = WebDriverWait(driver, 10)
wait.until(EC.presenceofelement_located(("id", "main")))

2. 中文路径报错

使用原始字符串处理路径：
python save_path = r"D:\截图\百度首页.png"

3. 元素被遮挡

滚动到元素可见区域：
python driver.execute_script("arguments[0].scrollIntoView();", element)

六、性能优化建议

复用浏览器实例：避免频繁启动/关闭浏览器
并行处理：使用concurrent.futures实现多页面同时截图
分辨率控制：
python options.add_argument("--window-size=1440,900")

结语

通过selenium实现网页截图，我们不仅完成了基础功能，还探讨了元素截图、全页捕获等进阶用法。实际项目中建议结合Pillow库进行图像压缩/水印添加，构建更完整的自动化工作流。遇到问题时，记得检查驱动版本与浏览器是否匹配，这是90%错误的原因。

实践提示：尝试用定时任务（如APScheduler）实现每日自动截图，打造你的网站监控系统！

自动化测试 Python网页截图 selenium教程无头浏览器 chromedriver

朗读

版权属于：

至尊技术网

本文链接：

https://www.zzwws.cn/archives/32184/（转载时请注明本文出处及文章链接）

作品采用：

《署名-非商业性使用-相同方式共享 4.0 国际 (CC BY-NC-SA 4.0)》许可协议授权