概述
mysql 的 explain 命令用于分析 sql 查询的执行计划(execution plan),它可以输出查询如何被优化器处理,包括表扫描方式、索引使用、连接顺序、行数估计等。通过分析 explain 的输出(如 id、select_type、type、possible_keys、key、rows、extra 等字段),可以排查查询性能问题,帮助优化慢查询、减少资源消耗。explain 一般能排查以下类型的问题:
- 索引使用不当:如未使用索引导致全表扫描(type: all),或使用了低效索引。
- 连接顺序问题:如大表驱动小表,导致笛卡尔积或低效连接(type: ref 或 eq_ref 不理想)。
- 子查询或派生表优化问题:如子查询未优化成连接,导致多次执行(select_type: subquery 或 dependent subquery)。
- 排序和分组问题:如使用文件排序(extra: using filesort)或临时表(extra: using temporary),表示内存不足或缺少索引支持。
- 行数估计不准:rows 值过大,表示优化器估计错误,可能因统计信息过时。
- 其他额外操作:如使用临时表、回表查询(key_len 不匹配)等,导致 i/o 开销高。
explain 不能直接排查硬件问题(如 cpu/内存不足)或锁争用,但能间接指出查询效率瓶颈。以下是多个例子,每个例子包括问题描述、explain 输出示例、业务场景,以及优化建议。例子基于常见 mysql 场景,假设使用 innodb 引擎。
示例详解
示例 1: 全表扫描(未使用索引)
- 问题描述:查询未使用索引,导致全表扫描(type: all),扫描行数巨大,查询变慢。
- explain 输出示例:
- id: 1 select_type: simple table: users type: all possible_keys: null key: null rows: 1000000 extra: using where
这里 type 为 all,表示全表扫描;rows 为 1000000,表示扫描了百万行。
- 业务场景:在一个电商平台的用户管理系统中,需要查询所有活跃用户(status = ‘active’)。用户表有 100 万行,但 status 字段未建索引。高峰期查询耗时 10 秒以上,导致页面加载慢,用户投诉订单确认延迟。
- 优化建议:在 status 字段添加索引(
alter table users add index idx_status (status)),重新执行 explain,type 变为 ref 或 range,rows 减少到几千行,查询时间降到毫秒级。
示例 2: 低效连接顺序(大表驱动小表)
- 问题描述:多表连接时,优化器选择了错误的连接顺序,导致大表作为驱动表,产生大量中间结果。
- explain 输出示例:
- id: 1 select_type: simple table: large_orders (大表,100万行) type: all possible_keys: null key: null rows: 1000000 extra: null id: 1 select_type: simple table: small_users (小表,1万行) type: ref possible_keys: idx_user_id key: idx_user_id rows: 1 extra: using where
这里大表 large_orders 先扫描,导致效率低。
- 业务场景:在金融 app 的交易记录系统中,需要联查用户表(小表)和订单表(大表)来统计用户交易总额。订单表有百万行,用户表只有万行。但由于连接条件不当,高峰期报表生成需几分钟,影响财务人员实时分析交易风险。
- 优化建议:调整 sql 连接顺序,使用
straight_join强制小表驱动大表,或优化索引确保小表先连接。优化后,explain 显示小表先 type: all 或 index,整体 rows 减少,查询加速 5 倍以上。
示例 3: 子查询未优化(多次执行子查询)
- 问题描述:子查询未被优化成连接,导致每次主查询都独立执行子查询,效率低下(select_type: subquery)。
- explain 输出示例:
- id: 1 select_type: primary table: products type: all rows: 50000 extra: using where id: 2 select_type: subquery table: inventory type: all rows: 10000 extra: null
子查询独立执行,可能被调用多次。
- 业务场景:在库存管理系统中,查询所有销量大于平均销量的产品,使用子查询计算平均值。产品表 5 万行,库存表 1 万行。双 11 促销期,库存检查查询频繁执行,导致数据库负载高,系统响应变慢,影响商家实时补货决策。
- 优化建议:将子查询改写为 join 或使用 with 子句(cte)。优化后,explain 显示 select_type: derived(派生表),子查询只执行一次,查询时间从秒级降到毫秒,系统负载降低 30%。
示例 4: 文件排序问题(缺少排序索引)
- 问题描述:查询涉及 order by 但无对应索引,导致使用文件排序(extra: using filesort),磁盘 i/o 高。
- explain 输出示例:
id: 1 select_type: simple table: logs type: ref possible_keys: idx_date key: idx_date rows: 200000 extra: using where; using fileso
extra 中有 using filesort,表示排序在磁盘上进行。
- 业务场景:在日志分析平台中,按时间降序查询最近 1 个月的访问日志。日志表有 20 万行,无创建时间索引。运维团队每天生成报告时,查询耗时长,导致服务器 cpu 占用率飙升,影响其他服务如用户登录。
- 优化建议:在 order by 字段(如 created_at)添加复合索引(
alter table logs add index idx_date_created (date, created_at desc))。优化后,extra 变为 using index,排序在内存中完成,报告生成时间缩短 80%。
示例 5: 使用临时表(group by 低效)
- 问题描述:group by 或 distinct 操作缺少支持索引,导致创建临时表(extra: using temporary),内存或磁盘消耗大。
- explain 输出示例:
id: 1 select_type: simple table: sales type: all rows: 300000 extra: using temporary; using file
extra 有 using temporary,表示创建了临时表。
- 业务场景:在 crm 系统(客户关系管理)中,按地区分组统计销售总额。销售表 30 万行,无地区索引。月度业绩报告生成时,查询卡住几分钟,影响销售经理评估团队绩效和调整营销策略。
- 优化建议:在 group by 字段(如 region)添加索引,并确保 where 条件也覆盖索引。优化后,extra 移除 using temporary,查询使用索引覆盖,报告生成即时完成,提高了决策效率。
示例 6: 回表查询(非覆盖索引)
- 问题描述:索引未覆盖所有 select 字段,导致回表查询(key_len 小于预期,extra: using index condition),增加 i/o。
- explain 输出示例:
- extra 有 using temporary,表示创建了临时表。
- 业务场景:在 crm 系统(客户关系管理)中,按地区分组统计销售总额。销售表 30 万行,无地区索引。月度业绩报告生成时,查询卡住几分钟,影响销售经理评估团队绩效和调整营销策略。
- 优化建议:在 group by 字段(如 region)添加索引,并确保 where 条件也覆盖索引。优化后,extra 移除 using temporary,查询使用索引覆盖,报告生成即时完成,提高了决策效率。
id: 1 select_type: simple table: employees type: ref possible_keys: idx_dept key: idx_dept key_len: 4 rows: 5000 extra: using index condition
key_len 短,表示只用了部分索引,需要回表取其他列。
- 业务场景:在 hr 系统(人力资源)中,查询某个部门的所有员工姓名和薪资。员工表 5 万行,部门索引存在但不覆盖姓名薪资。批量导出员工数据时,查询慢,导致 hr 无法及时处理 payroll(工资单),影响员工满意度。
- 优化建议:创建覆盖索引(
alter table employees add index idx_dept_name_salary (dept_id, name, salary))。优化后,extra 变为 using index(索引覆盖),无需回表,导出速度提升 10 倍。
总结
通过这些例子,可以看到 explain 是优化 mysql 查询的核心工具。在实际业务中,结合慢查询日志(slow log)和 show status 检查全局性能,能更全面排查问题。如果查询复杂,建议使用 explain analyze(mysql 8.0+)获取实际执行统计。
到此这篇关于mysql explain排查问题指南的文章就介绍到这了,更多相关mysql explain排查内容请搜索代码网以前的文章或继续浏览下面的相关文章希望大家以后多多支持代码网!
发表评论