使用selenium库模拟操作edge_交互

使用selenium库模拟操作edge浏览器

安装前准备
1. 安装selenium库
  
  可以使用pip安装：
  
  当然也可以在pycharm解释器中按加号搜索selenium安装
2. 安装浏览器驱动（edge为例）
  1. 先要确定当前浏览器版本
    
    可以在edge://settings/help网站查看。
  2. 下载浏览器驱动
    
    在microsoft edge webdriver |microsoft edge 开发人员可以下载。我的版本为123.0.2420.97，进入界面后下滑找到对应版本。x64是64位，x86是32位。
  3. 编辑环境变量
    - 先找到浏览器安装位置
      
      右键桌面快捷方式查看属性，可以得到文件安装位置，我的位置是c:\program files (x86)\microsoft\edge\application。
    - 解压浏览器驱动安装包，同样右键解压后的exe文件得到位置。
    - 我是windows系统，打开环境变量，在系统变量找到‘path’，添加上面得到的位置。如图。
  4. 测试环境变量是否配置成功。
    
    win+r打开cmd，输入msedge.exe能打开浏览器就算成功。

简单示例代码

爬取百度搜索页面案例

from selenium import webdriver
from selenium.webdriver.common.by import by
from time import sleep

# 百度搜索内容
# 初始化浏览器
driver = webdriver.edge()
# 用get打开百度页面
driver.get('https://www.baidu.com')
# 找到百度的输入框，并输入“美少女战士”
driver.find_element(by.id, 'kw').send_keys('美少女战士')
sleep(2)
# 点击搜索按钮
driver.find_element(by.id, 'su').click()
sleep(5)
content = driver.find_element(by.id, 'content_left').text
print(content)
driver.quit()

部分结果如下：

在这里插入图片描述

爬取豆瓣电影top250（图片多，加载较慢）

from selenium import webdriver
from selenium.webdriver.common.by import by
from time import sleep
from bs4 import beautifulsoup

# 爬取豆瓣电影数据
movies_total = []
# 初始化浏览器
driver = webdriver.edge()
# 用get打开豆瓣电影页面
base_url = "https://movie.douban.com/top250"
for i in range(0, 10):
    url = base_url + "?start=" + str(i * 25)
    # 发送请求
    driver.get(url)
    sleep(2)
    html = driver.page_source
    soup=beautifulsoup(html, "lxml")
    # 解析数据
    title_list = soup.select('.grid_view>li a>.title')
    for title in title_list:
        movies = '《'+ title.text + '》'
        if '/' not in movies:
            movies_total.append(movies)
    print('第%d至%d部电影已爬取' % (i * 25 + 1, (i + 1) * 25))
#持久化存储
with open('./douban_bs.doc', 'w', encoding='utf-8') as f:
    for movie in movies_total:
        f.write(movie)
print('爬取完毕')
driver.quit()

输出结果如下图：

在这里插入图片描述

总结selenium的一些常用方法

# 访问url
driver.get("https://www.example.com")
# 关闭当前浏览器窗口
driver.close()
# 退出浏览器进程，关闭所有相关窗口
driver.quit()
# 后退
driver.back()
# 前进
driver.forward()
# 刷新窗口
driver.refresh()
# 获取整张页面资源
driver.page_source

交互操作

# 点击元素
element = driver.find_element(by.id, 'button_id')
element.click()

# 输入文本
textbox = driver.find_element(by.name, 'textbox_name')
textbox.send_keys('hello, selenium!')

#清除文本框内容
textbox.clear()

# 输入文本
textbox = driver.find_element(by.name, 'textbox_name')
textbox.send_keys('hello, selenium!')

#清除文本框内容
textbox.clear()

分享基于鸿蒙OpenHarmony的Unity团结引擎应用开发赛

目前团结引擎已全面适配OpenHarmony系统，包括Ability框架、XComponent、ArkUI、音视频、文件系统、触控系统等。确保丝滑工作流，兼容老版本项目，支持一键切…

2024年08月06日 • 软件设计

用VRTK4.0如何实现与UI交互（保姆级别教程）

五步教你完成VR中与UI的交互新手教程1.导入Tilia.UnityUI-master包2.Tilia.UnityUI-master使用环境3.创建画布和设置4... [阅读全文]

深度强化学习在虚拟现实中的潜力：从游戏到教育

1.背景介绍深度强化学习(Deep Reinforcement Learning, DRL)是一种人工智能技术，它结合了神经网络和强化学习，具有很强的学习能力和... [阅读全文]

HarmonyOS 应用开发案例

该组件多用于可视化等场景。TabBar在大部分的APP当中都能够使用到，不同的APP可能存在不一样的TabBar样式，Tab组件自带的TabBar属性对于部分效果无法满足，如页签中…

2024年08月06日 • 软件设计

16.4 云计算

基本特性广域网络访问：允许异构客户端通过标准机制访问云服务。快速弹性：资源可以迅速扩张或缩减，以满足需求变化。计量服务：资源使用被监控、控制和报告，以实现透明性。按需自助服务：用户…

2024年08月06日 • 软件设计

从单体架构到微服务，大厂意外流出

1.1、单体架构Web应用程序发展的早期，大部分web工程师将所有的功能模块打包到一起并放在一个web容器中运行，所有功能模块使用同一个数据库，同时，它还提供API或者UI访问的w…

2024年08月06日 • 软件设计


验证码：

验证码：

使用selenium库模拟操作edge

2024年08月06日 • 交互 •我要评论

使用selenium库模拟操作edge浏览器

安装前准备

安装selenium库

安装浏览器驱动（edge为例）

简单示例代码

总结selenium的一些常用方法

相关文章:

分享基于鸿蒙OpenHarmony的Unity团结引擎应用开发赛

HarmonyOS 应用开发案例

16.4 云计算

从单体架构到微服务，大厂意外流出

发表评论