一、requests 库简介
requests 是 python 生态中 最广泛使用的 http 客户端库,以「人类友好」为核心设计理念,简化了 http 协议交互的复杂性。其核心价值包括:
- 极简 api:通过
requests.get()
、post()
等函数实现复杂网络操作,代码量比原生urllib
减少 70% 以上。 - 全协议支持:覆盖 get、post、put、delete 等主流 http 方法,适配 restful api、websocket 等场景。
- 高效稳定:内置连接池复用、自动重试、超时控制等机制,支持每秒 1000+ 次高并发请求。
- 生态兼容:无缝对接
beautifulsoup
(网页解析)、pandas
(数据处理)、flask
(服务测试)等工具链。
二、安装与环境配置
# 基础安装(python 3.7+ 环境) pip install requests # 国内镜像加速安装 pip install -i https://pypi.tuna.tsinghua.edu.cn/simple requests
验证安装:
import requests print(requests.__version__) # 输出示例:2.31.0
三、核心功能与常用函数
1. http 基础请求方法
函数 | 功能描述 | 示例代码 |
---|---|---|
**requests.get()** | 发送 get 请求(数据获取场景) | response = requests.get("https://api.github.com") |
**requests.post()** | 发送 post 请求(表单提交/api 调用) | requests.post("https://httpbin.org/post", data={"key": "value"}) |
**requests.put()** | 发送 put 请求(资源更新) | requests.put("https://api.example.com/data/1", json={"name": "kimi"}) |
**requests.delete()** | 发送 delete 请求(资源删除) | requests.delete("https://api.example.com/data/1") |
**requests.session()** | 创建会话对象(保持 cookies 和 tcp 连接复用,提升性能) | with requests.session() as s: s.get("https://example.com") |
2. 请求参数与定制化
查询参数传递:
params = {"q": "python", "page": 2} response = requests.get("https://search.example.com", params=params)
生成 url:
https://search.example.com?q=python&page=2
请求头定制:
headers = {"user-agent": "mozilla/5.0", "authorization": "bearer your_token"} requests.get("https://api.example.com", headers=headers)
模拟浏览器行为或身份验证
json 数据提交:
requests.post("https://api.example.com/login", json={"username": "admin", "password": "secret"})
自动设置
content-type: application/json
3. 响应处理与解析
属性/方法 | 功能描述 | 示例代码 |
---|---|---|
**response.status_code** | 获取 http 状态码(如 200 表示成功,404 资源未找到) | if response.status_code == 200: print("成功") |
**response.text** | 获取响应内容(自动解码文本,如 html/xml) | print(response.text[:500]) # 截取前500字符 |
**response.json()** | 解析 json 响应为 python 字典或列表 | data = response.json(); print(data["temperature"]) |
**response.headers** | 获取响应头信息(如服务器类型、缓存策略) | print(response.headers["content-type"]) |
**response.raise_for_status()** | 自动抛出异常(状态码非 200 时触发) | try: response.raise_for_status() except requests.httperror: ... |
4. 高级功能
文件上传与下载:
# 上传文件 files = {"file": open("report.pdf", "rb")} requests.post("https://api.example.com/upload", files=files)[4,6](@ref) # 流式下载大文件 with requests.get("https://example.com/large_video.mp4", stream=true) as r: with open("video.mp4", "wb") as f: for chunk in r.iter_content(chunk_size=8192): f.write(chunk)
超时与重试策略:
from requests.adapters import httpadapter from urllib3.util.retry import retry retry = retry(total=3, backoff_factor=1, status_forcelist=[500, 502, 503]) adapter = httpadapter(max_retries=retry) session = requests.session() session.mount("https://", adapter) session.get("https://unstable-api.com", timeout=5) # 超时5秒,重试3次[4,6](@ref)
四、应用场景与实战案例
数据采集与爬虫:
- 抓取新闻标题:
requests.get()
+beautifulsoup
解析 html - 动态内容加载:配合
selenium
处理 javascript 渲染页面
- 抓取新闻标题:
api 集成开发:
- 调用天气接口:
requests.get("https://weather-api.com?city=北京")
- 对接 chatgpt:发送 json 请求并处理流式响应
- 调用天气接口:
自动化测试:
- 验证 rest api 功能:断言响应状态码和数据格式
- 压力测试:多线程并发发送请求(需结合
concurrent.futures
)
企业级应用:
- 财务报表批量下载:会话保持 + 定时任务
- 跨系统数据同步:oauth 认证 + post/put 方法
五、注意事项与优化技巧
安全规范:
- 敏感数据(如 api key)避免硬编码,使用环境变量管理
- 启用 https 并验证证书:
verify=true
(默认)
性能调优:
- 复用
session
对象减少 tcp 握手开销 - 设置合理超时:
timeout=10
防止阻塞主线程
- 复用
异常处理:
try: response = requests.get(url, timeout=5) response.raise_for_status() except requests.timeout: print("请求超时") except requests.connectionerror: print("网络连接失败")
到此这篇关于python中requests库的实现示例的文章就介绍到这了,更多相关python requests库内容请搜索代码网以前的文章或继续浏览下面的相关文章希望大家以后多多支持代码网!
发表评论