在python自动化领域,selenium和requests是两个常用工具,但各有局限。drissionpage巧妙结合了两者优势,既能用浏览器自动化处理动态页面,又能通过http请求提升效率。本文将带你从零开始,用10分钟掌握drissionpage的核心用法。
一、drissionpage是什么?
drissionpage是一个混合驱动的网页自动化库,核心特点:
- 双引擎驱动:支持selenium(浏览器渲染)和requests(http请求)无缝切换
- 简洁api:类似jquery的选择器语法,操作更直观
- 智能等待:自动处理元素加载延迟
- 多浏览器支持:chrome/firefox/edge等
适合场景:
- 网页数据采集
- 自动化测试
- 表单填写
- 文件上传/下载
- 任何需要模拟用户操作的场景
二、快速安装
pip install drissionpage
如果使用selenium模式,需额外下载对应浏览器的webdriver(如chromedriver)
三、5分钟上手基础操作
1. 初始化浏览器会话
from drissionpage import chromiumpage # 以chrome为例
# 启动浏览器(无头模式可加headless=true)
page = chromiumpage()
# 访问网页
page.get('https://www.baidu.com')
2. 元素定位与操作
# 通过id定位搜索框并输入内容
search_box = page.ele('#kw') # css选择器语法
search_box.input('python自动化')
# 通过文本定位按钮并点击
search_btn = page.ele('text:百度一下')
search_btn.click()
3. 获取页面数据
# 获取标题
print(page.title)
# 获取当前url
print(page.url)
# 获取元素文本(如第一条搜索结果)
first_result = page.eles('div.result')[0].text
print(first_result)
4. 完整示例:百度搜索
from drissionpage import chromiumpage
# 初始化
page = chromiumpage()
page.get('https://www.baidu.com')
# 操作
page.ele('#kw').input('drissionpage')
page.ele('text:百度一下').click()
# 获取结果
results = page.eles('div.result c-container')
for i, result in enumerate(results[:3], 1):
print(f"{i}. {result.text.split('\n')[0]}")
# 关闭浏览器
page.close()
四、进阶功能速览
1. 智能等待机制
# 等待元素出现(最多10秒)
element = page.wait('@div.loading', timeout=10) # @表示css选择器
# 等待页面标题包含特定文本
page.wait('title:结果页面')
2. 切换窗口/iframe
# 切换到新标签页
page.switch_to.new_tab('https://example.com')
# 切换到iframe
page.switch_to.frame('iframe_id') # 或通过索引page.switch_to.frame(0)
3. 文件上传
# 直接操作隐藏的file input
upload_input = page.ele('input[type="file"]')
upload_input.send_keys(r'c:\test\file.jpg')
4. 执行javascript
# 获取页面js变量
window_width = page.run_js('return window.innerwidth')
print(f"窗口宽度: {window_width}")
# 修改页面样式
page.run_js('document.body.style.backgroundcolor = "lightblue"')
五、常见问题解决
1. 元素找不到?
- 检查选择器是否正确(推荐使用浏览器开发者工具复制css选择器)
- 添加显式等待:
page.wait('@selector', timeout=10) - 确认元素是否在iframe中
2. 如何处理登录弹窗?
# 示例:处理基本认证弹窗
page.set_auth('username', 'password')
page.get('https://example.com/protected')
3. 如何截图保存?
page.save('screenshot.png') # 保存当前页面截图
4. 无头模式设置
# 启动时添加参数 page = chromiumpage(headless=true) # 无界面模式
六、学习资源推荐
- 官方文档:github - drissionpage(含完整api参考)
- 选择器练习:使用浏览器开发者工具的
copy selector功能快速获取元素定位方式 - 实战项目:尝试自动化登录知乎/微博等网站(注意遵守robots协议)
七、总结
drissionpage通过统一api简化了网页自动化流程,无论是简单的数据抓取还是复杂的交互操作都能轻松应对。对于初学者,建议从以下步骤开始:
- 掌握基础元素操作(点击/输入/获取文本)
- 学会使用等待机制处理动态内容
- 尝试组合多个操作完成完整流程
掌握这些核心概念后,你可以快速扩展到文件上传、自动化测试等更复杂的场景。现在打开ide,开始你的第一个drissionpage自动化项目吧!
到此这篇关于python使用drissionpage实现自动化处理的简单入门指南的文章就介绍到这了,更多相关python drissionpage自动化内容请搜索代码网以前的文章或继续浏览下面的相关文章希望大家以后多多支持代码网!
发表评论