当前位置: 代码网 > it编程>前端脚本>Python > Python桌面自动化框架PyAutoGUI功能详解

Python桌面自动化框架PyAutoGUI功能详解

2026年03月27日 Python 我要评论
一、pyautogui 核心介绍pyautogui 是一款跨平台(支持 windows、macos、linux)的 python 桌面自动化库,能够模拟用户的鼠标移动、点击、滚轮操作和键盘输入,还支持

一、pyautogui 核心介绍

pyautogui 是一款跨平台(支持 windows、macos、linux)的 python 桌面自动化库,能够模拟用户的鼠标移动、点击、滚轮操作键盘输入,还支持屏幕截图、图像识别定位等功能,广泛用于重复性桌面操作自动化(如表单填写、软件操作、批量处理等)。

二、安装步骤

直接通过 pip 命令安装,命令简洁无复杂依赖:

pip install pyautogui

补充:若安装失败(如 macos 需额外依赖),可参考官方文档适配系统环境,windows 系统通常可直接安装成功。

三、核心功能详解

自动获取当前鼠标位置:

import pyautogui
import time
try:
    while true:
        x, y = pyautogui.position()    #获得鼠标所在位置
        print(x,y)     #打印当前鼠标所处位置
        time.sleep(1)
except keyboardinterrupt:
    print('\nexit.')

(一)鼠标操作:模拟用户鼠标行为

pyautogui 提供了完整的鼠标模拟接口,核心包括移动、点击、拖拽等,所有操作均基于屏幕坐标系统(屏幕左上角为原点 (0, 0),向右为 x 轴正方向,向下为 y 轴正方向)。

1. 鼠标移动

  • 基础移动:将鼠标从当前位置移动到指定坐标 (x, y)
import pyautogui
# duration:移动耗时(秒),可选参数,默认瞬间移动
pyautogui.moveto(x=100, y=200, duration=0.5)
  • 相对移动:基于当前鼠标位置,偏移指定像素(dx 为 x 轴偏移,dy 为 y 轴偏移)
# 向右移动 50 像素,向下移动 30 像素,耗时 0.3 秒
pyautogui.moverel(dx=50, dy=30, duration=0.3)

2. 鼠标点击

  • 基础点击:在指定坐标执行鼠标左键单击
# 在 (100, 200) 位置单击左键,duration 为移动到目标位置的耗时
pyautogui.click(x=100, y=200, duration=0.2)
  • 指定按键点击:支持左键(left)、右键(right)、中键(middle)
# 右键单击
pyautogui.click(x=100, y=200, button='right', duration=0.2)
# 中键单击
pyautogui.click(x=100, y=200, button='middle', duration=0.2)
  • 双击/三击:快速执行多次点击
# 左键双击
pyautogui.doubleclick(x=100, y=200, duration=0.2)
# 左键三击
pyautogui.tripleclick(x=100, y=200, duration=0.2)

3. 鼠标拖拽

模拟鼠标按住并拖动的行为,常用于文件拖拽、窗口调整等场景:

# 从 (x1, y1) 拖拽到 (x2, y2),按住左键拖拽
pyautogui.dragto(x=300, y=400, duration=0.8, button='left')
# 相对拖拽:基于当前位置偏移拖拽
pyautogui.dragrel(dx=100, dy=50, duration=0.5, button='left')

4. 鼠标滚轮

模拟滚轮滚动行为,clicks 参数指定滚动幅度(正数向上滚,负数向下滚):

# 向下滚动 5 格(负数表示向下)
pyautogui.scroll(clicks=-5, x=100, y=200)
# 向上滚动 3 格(正数表示向上)
pyautogui.scroll(clicks=3, x=100, y=200)

(二)键盘操作:模拟输入与快捷键

1. 普通文本输入

使用 typewrite() 方法输入字符串,支持指定输入间隔(模拟人工输入速度):

# 直接输入文本
pyautogui.typewrite("hello, pyautogui!")
# 带间隔输入(每个字符间隔 0.2 秒)
pyautogui.typewrite("hello, pyautogui!", interval=0.2)

2. 特殊按键输入

对于回车键、空格键、快捷键等特殊按键,需使用按键名称(封装在 pyautogui 中),核心方法:

  • press():单次按下并释放某个按键
  • keydown():按住某个按键不释放
  • keyup():释放按住的按键
# 单个特殊按键:按下并释放回车键
pyautogui.press('enter')
# 组合快捷键:ctrl + c(复制)
pyautogui.keydown('ctrl')
pyautogui.press('c')
pyautogui.keyup('ctrl')
# 简化组合快捷键:使用 hotkey() 方法(推荐)
pyautogui.hotkey('ctrl', 'c')  # 复制
pyautogui.hotkey('ctrl', 'v')  # 粘贴
pyautogui.hotkey('ctrl', 'a')  # 全选

常用特殊按键名称:enter(回车)、space(空格)、backspace(删除)、tab(制表符)、shiftctrlalt 等。

(三)屏幕与图像识别:定位目标元素

1. 屏幕基础信息获取

获取屏幕分辨率(用于确定坐标范围):

# 获取屏幕宽度和高度
screen_width, screen_height = pyautogui.size()
print(f"屏幕分辨率:{screen_width} × {screen_height}")
# 获取当前鼠标位置坐标
mouse_x, mouse_y = pyautogui.position()
print(f"当前鼠标位置:({mouse_x}, {mouse_y})")

2. 图像定位:查找屏幕上的目标图像

pyautogui 支持通过目标图像(如按钮截图、图标截图),自动查找其在屏幕上的坐标,核心方法 locateonscreen()

步骤说明

  1. 先截取目标元素的截图(保存为 png 格式,推荐使用截图工具精准截取)
  2. 使用 locateonscreen() 查找图像位置,返回目标区域的坐标和尺寸
  3. 通过 center() 方法获取目标区域的中心坐标(便于点击等操作)
import pyautogui
import time
# 等待 3 秒,预留时间切换到目标屏幕
time.sleep(3)
try:
    # 查找目标图像(image.png 为目标截图路径)
    # confidence:匹配精度(0-1,默认 1,降低精度可提高查找成功率,需安装 opencv-python 支持)
    target_location = pyautogui.locateonscreen('image.png', confidence=0.8)
    if target_location:
        # 获取目标图像的中心坐标
        target_center = pyautogui.center(target_location)
        print(f"目标图像位置:{target_location},中心坐标:{target_center}")
        # 点击目标中心
        pyautogui.click(target_center.x, target_center.y, duration=0.2)
    else:
        print("未找到目标图像")
except exception as e:
    print(f"查找失败:{e}")

注意:使用 confidence 参数时,需额外安装 opencv-pythonpip install opencv-python

3. 屏幕截图

# 截取整个屏幕并保存为文件
pyautogui.screenshot('full_screen.png')
# 截取指定区域屏幕(x1, y1, 宽度, 高度)
pyautogui.screenshot('partial_screen.png', region=(100, 100, 300, 200))

(四)安全机制:防止自动化失控

pyautogui 提供了关键的安全保护机制,避免自动化操作失控(如鼠标移到屏幕边缘无法找回、无限循环操作等):

1. 故障安全触发

默认开启:当鼠标移动到屏幕左上角(坐标 (0, 0))时,会立即抛出 failsafeexception 异常,终止所有自动化操作:

# 若操作失控,快速将鼠标移到屏幕左上角即可停止程序
try:
    while true:
        pyautogui.moverel(10, 0, duration=0.1)
except pyautogui.failsafeexception:
    print("故障安全机制触发,程序终止")

2. 操作延迟

通过 pause 属性设置所有 pyautogui 操作的默认间隔时间(秒),便于观察操作过程,也可防止操作过快导致程序异常:

# 设置所有操作间隔 0.5 秒
pyautogui.pause = 0.5

四、实战示例:简单自动化操作

import pyautogui
import time
# 安全设置
pyautogui.pause = 0.5  # 操作间隔 0.5 秒
pyautogui.failsafe = true  # 开启故障安全机制
# 1. 等待 5 秒,预留时间打开记事本
print("5 秒后开始操作,请打开记事本...")
time.sleep(5)
# 2. 输入文本
pyautogui.typewrite("python 自动化 - pyautogui 实战", interval=0.1)
# 3. 换行
pyautogui.press('enter')
# 4. 输入第二行文本
pyautogui.typewrite("这是一个简单的自动化演示", interval=0.1)
# 5. 全选文本(ctrl + a)
pyautogui.hotkey('ctrl', 'a')
# 6. 复制文本(ctrl + c)
pyautogui.hotkey('ctrl', 'c')
# 7. 弹窗提示操作完成
pyautogui.alert("自动化操作完成!")

总结 

到此这篇关于python桌面自动化框架pyautogui功能的文章就介绍到这了,更多相关python桌面自动化框架pyautogui内容请搜索代码网以前的文章或继续浏览下面的相关文章希望大家以后多多支持代码网!

(0)

相关文章:

版权声明:本文内容由互联网用户贡献,该文观点仅代表作者本人。本站仅提供信息存储服务,不拥有所有权,不承担相关法律责任。 如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 2386932994@qq.com 举报,一经查实将立刻删除。

发表评论

验证码:
Copyright © 2017-2026  代码网 保留所有权利. 粤ICP备2024248653号
站长QQ:2386932994 | 联系邮箱:2386932994@qq.com