mysql 作为主流关系型数据库,索引是提升查询性能的核心手段。多数开发者仅会创建基础索引,但对索引原理、创建原则、失效场景、慢查询优化理解不足,导致索引 “形同虚设”,甚至因索引设计不当引发性能问题(如索引冗余、写入变慢)。
本文从索引核心原理出发,讲解索引类型、创建原则、失效场景、慢查询分析、分场景优化方案,结合 sql 示例与执行计划分析,帮你避开索引坑,设计出高效索引,将慢查询优化为毫秒级响应。
一、核心认知:索引的价值与底层原理
1. 核心价值
- 加速查询:将全表扫描(o (n))转化为索引有序查找(o (log n)),大幅减少数据扫描量;
- 优化排序:索引本身是有序的,若查询包含排序字段,可直接利用索引排序,避免额外排序操作;
- 优化连接:多表联查时,索引可加速关联字段的匹配,减少表关联时的扫描次数。
2. 底层原理(b + 树索引)
mysql 中最常用的索引类型是 b + 树索引(主键索引、二级索引均基于 b + 树实现),其结构特点决定了高效查询:
- b + 树是平衡多路查找树,高度低(一般 3-4 层),无论数据量多大,单次查询都只需 3-4 次磁盘 io;
- 叶子节点存储完整数据(主键索引)或主键值(二级索引),叶子节点间用链表连接,支持范围查询;
- 非叶子节点仅存储索引键,不存储数据,减少磁盘占用,提升查询效率。
3. 索引类型与适用场景
(1)主键索引(聚簇索引,primary key)
- 特点:默认自动创建,唯一且非空,叶子节点存储整行数据;
- 适用场景:按主键查询(如
select * from user where id = 123); - 注意:一张表仅能有一个主键索引,建议用自增 id 作为主键(避免主键无序导致 b + 树分裂,影响性能)。
(2)二级索引(非聚簇索引,secondary index)
- 特点:基于非主键字段创建,叶子节点存储主键值,查询时需通过主键值回表查询完整数据(回表操作);
- 分类:
- 唯一索引(unique):索引键唯一(允许空值),避免重复数据(如
user_phone唯一索引); - 普通索引(normal):无唯一性约束,适用于高频查询字段(如
user_name普通索引); - 联合索引(composite):基于多个字段创建,遵循 “最左前缀原则”,适用于多字段查询(如
(order_no, create_time)联合索引)。
(3)其他索引类型
- 全文索引(fulltext):适用于文本字段(如
content)的模糊查询,不适合精确匹配; - 哈希索引(hash):基于哈希表实现,仅支持等值查询,不支持范围查询、排序,mysql 中 innodb 不支持手动创建哈希索引(仅自适应使用)。
二、实战:索引创建原则与最佳实践
1. 核心创建原则(避免无效索引)
(1)高频查询字段优先创建索引
- 优先为
where条件、join关联字段、order by/group by字段创建索引; - 示例:高频查询
select * from order where order_no = 'od20240520',为order_no创建普通索引。
(2)联合索引遵循 “最左前缀原则”
- 联合索引
(a, b, c)的有效查询场景:a、a+b、a+b+c,无效场景:b、b+c、c; - 设计技巧:将区分度高的字段放在前面(区分度 = 不重复值数量 / 总记录数,如身份证号区分度高于性别);
- 示例:查询
select * from order where user_id = 123 and create_time between '2024-05-01' and '2024-05-31',创建联合索引(user_id, create_time)(user_id区分度更高)。
(3)避免创建冗余索引
- 冗余索引:索引 a 包含索引 b 的所有字段,且顺序一致(如
(a)与(a, b),(a, b)与(a, b, c)); - 危害:增加写入成本(insert/update/delete 时需同步维护索引),占用磁盘空间;
- 示例:已创建联合索引
(user_id, create_time),无需再创建user_id单独索引。
(4)低频查询、低区分度字段不创建索引
- 低区分度字段(如性别、状态,值仅 2-3 种):索引无法有效过滤数据,查询效率甚至低于全表扫描;
- 低频查询字段:索引维护成本高于查询收益,得不偿失。
(5)避免对大字段创建索引
- 大字段(如
text、varchar(2000)):索引占用磁盘空间大,查询时 io 成本高; - 替代方案:仅对大字段的前缀创建索引(如
index idx_content (content(32))),或用全文索引。
2. 分场景索引设计示例
(1)单表查询优化
| 业务场景 | sql 语句 | 索引设计 | 备注 |
|---|---|---|---|
| 按订单号精确查询 | select * from order where order_no = 'od123' | 普通索引idx_order_no (order_no) | 精确匹配,单字段索引足够 |
| 按用户 id + 时间范围查询 | select * from order where user_id = 123 and create_time between '2024-05-01' and '2024-05-31' | 联合索引idx_user_create (user_id, create_time) | 遵循最左前缀,时间范围放在后面 |
| 按状态排序查询 | select * from order where status = 1 order by create_time desc | 联合索引idx_status_create (status, create_time desc) | 索引包含排序字段,避免额外排序 |
(2)多表联查优化
- 场景:查询用户及其订单列表(
user与order表联查); - 原始 sql:
select u.id, u.user_name, o.order_no, o.create_time from user u left join order o on u.id = o.user_id where u.id = 123 order by o.create_time desc;
- 索引设计:
user表主键索引(默认存在,id为主键);order表创建联合索引idx_user_create (user_id, create_time desc)(关联字段user_id在前,排序字段在后);
- 优化效果:联查时通过
user_id快速匹配订单,同时利用索引排序,无需全表扫描与额外排序。
(3)分页查询优化
- 慢查询示例(大数据量分页,如第 1000 页):
-- 慢查询:limit offset过大,需扫描前10000条数据,再取10条 select * from order order by create_time desc limit 10000, 10;
- 优化方案(利用索引定位起点,避免全表扫描):
- 创建索引
idx_create_id (create_time desc, id); - 优化 sql:
select o.* from order o where o.id < (select id from order order by create_time desc limit 10000, 1) order by create_time desc limit 10;
- 原理:子查询通过索引快速定位第 10000 条数据的
id,主查询通过id < 目标值过滤,仅扫描 10 条数据,大幅提升效率。
三、关键:索引失效场景与避坑
索引创建后若使用不当,会导致索引失效,触发全表扫描,需重点规避以下场景:
1. 场景 1:索引字段使用函数或运算
- 错误示例:
select * from user where left(user_name, 3) = '张'; -- 函数操作索引字段 select * from order where create_time + interval 1 day > now(); -- 运算操作索引字段
- 原因:函数 / 运算会改变索引字段的值,mysql 无法利用索引查找;
- 解决方案:改写 sql,将函数 / 运算移到右边:
select * from user where user_name like '张%'; -- 前缀匹配,索引有效 select * from order where create_time > now() - interval 1 day;
2. 场景 2:模糊查询以 “%” 开头
- 错误示例:
select * from user where user_name like '%三'; -- %开头,索引失效
- 原因:
%开头的模糊查询无法利用 b + 树索引的有序性,需全表扫描; - 解决方案:1. 前缀匹配(
like '张%',索引有效);2. 用全文索引(适用于文本字段)。
3. 场景 3:索引字段存在隐式转换
- 错误示例(
user_phone为 varchar 类型,传入数字):
select * from user where user_phone = 13800138000; -- 隐式转换,索引失效
- 原因:mysql 会将索引字段(varchar)转换为数字类型(
cast(user_phone as unsigned)),导致索引失效; - 解决方案:传入参数与字段类型一致,加引号:
select * from user where user_phone = '13800138000';
4. 场景 4:联合索引不满足最左前缀原则
- 错误示例(联合索引
(user_id, create_time)):
select * from order where create_time between '2024-05-01' and '2024-05-31'; -- 仅用第二个字段,索引失效
- 解决方案:补充最左前缀字段,或调整索引顺序(若
create_time查询更频繁)。
5. 场景 5:or 连接非索引字段
- 错误示例(
user_name有索引,phone无索引):
select * from user where user_name = '张三' or phone = '13800138000'; -- 索引失效
- 原因:or 连接的字段中存在无索引字段,mysql 无法确定是否使用索引,会触发全表扫描;
- 解决方案:为
phone也创建索引,或改用 union 连接。
6. 场景 6:where 条件恒成立 / 恒不成立
- 错误示例:
select * from user where 1 = 1; -- 恒成立,索引失效,全表扫描 select * from user where id = 123 and 1 = 0; -- 恒不成立,索引失效
- 解决方案:避免无效 where 条件,动态 sql 中移除恒成立 / 不成立条件。
四、慢查询分析工具与流程
1. 开启慢查询日志(定位慢查询)
mysql 默认关闭慢查询日志,需手动开启,记录执行时间超过阈值(默认 1 秒)的 sql:
-- 临时开启(重启mysql失效) set global slow_query_log = on; -- 开启慢查询日志 set global long_query_time = 1; -- 慢查询阈值(单位:秒) set global slow_query_log_file = '/var/lib/mysql/slow.log'; -- 日志存储路径 -- 永久开启(修改my.cnf配置文件,重启生效) [mysqld] slow_query_log = on long_query_time = 1 slow_query_log_file = /var/lib/mysql/slow.log log_queries_not_using_indexes = on -- 记录未使用索引的查询
2. 分析慢查询日志(explain 执行计划)
通过explain关键字分析 sql 执行计划,判断索引是否生效、是否全表扫描:
(1)explain 使用方法
在 sql 前加explain,示例:
explain select * from order where user_id = 123 and create_time between '2024-05-01' and '2024-05-31';
(2)核心字段解读(判断索引是否生效)
type:查询类型,优先级:system>const>eq_ref>ref>range>index>all;all:全表扫描(索引失效,需优化);range:范围查询(索引有效,如 between、in);ref/eq_ref:等值查询(索引有效)。key:实际使用的索引(若为 null,说明未使用索引);rows:mysql 预估扫描的行数(行数越少,效率越高);extra:额外信息,需警惕以下内容:using filesort:需额外排序(未利用索引排序,需优化);using temporary:创建临时表(效率低,需优化);using index:覆盖索引(无需回表,效率高);using where; using index:索引覆盖且有过滤条件,最优。
3. 慢查询优化流程
- 开启慢查询日志,收集慢查询 sql;
- 对慢查询 sql 执行
explain,分析执行计划,定位问题(索引失效、全表扫描、额外排序等); - 优化索引(创建新索引、调整联合索引顺序、删除冗余索引);
- 改写 sql(避免索引失效场景、优化分页逻辑);
- 验证优化效果(重新执行
explain,对比扫描行数、执行时间)。
五、避坑指南
1. 坑点 1:索引越多越好
- 表现:为表中大部分字段创建索引,导致写入操作(insert/update/delete)变慢,磁盘空间占用过大;
- 原因:写入时需同步维护所有索引的 b + 树结构,索引越多,维护成本越高;
- 解决方案:仅为高频查询字段创建索引,定期删除冗余、低效索引。
2. 坑点 2:主键用 uuid 而非自增 id
- 表现:uuid 无序,插入数据时会导致 b + 树频繁分裂、调整,写入性能差;
- 解决方案:用自增 id(int/bigint)作为主键,保证主键有序,减少 b + 树分裂;若需 uuid,可将 uuid 作为二级索引。
3. 坑点 3:忽略覆盖索引(避免回表)
- 表现:查询时使用二级索引,但需回表查询完整数据,增加 io 成本;
- 解决方案:创建覆盖索引(索引包含查询所需所有字段),示例:
-- 查询字段:user_id、create_time、order_no -- 覆盖索引:idx_user_create_no (user_id, create_time, order_no) select user_id, create_time, order_no from order where user_id = 123;
4. 坑点 4:索引字段允许 null 值
- 表现:null 值会影响索引的查询效率,mysql 对 null 值的处理特殊,无法有效利用索引;
- 解决方案:索引字段设置为 not null,用默认值(如空字符串、0)替代 null。
5. 坑点 5:未定期维护索引
- 表现:长期写入、删除数据后,索引出现碎片,查询效率下降;
- 原因:频繁删除数据会导致 b + 树出现空洞,碎片增多,扫描行数增加;
- 解决方案:定期执行
optimize table优化表,整理索引碎片(适用于 innodb 引擎)。
六、终极总结:索引优化的核心是 “精准与平衡”
mysql 索引优化不是 “盲目创建索引”,而是在 “查询性能” 与 “写入性能” 之间寻找平衡 —— 既要通过索引加速查询,又要控制索引数量,降低写入维护成本。
核心原则总结:
- 索引设计贴合业务:基于高频查询场景设计,避免无意义索引;
- 规避失效场景:熟练掌握索引失效规则,改写 sql 避免触发;
- 善用工具:通过慢查询日志、explain 定位问题,验证优化效果;
- 持续维护:定期清理冗余索引、优化索引碎片,适配业务迭代。
记住:最好的索引不是 “最复杂的”,而是 “最贴合业务、最高效、维护成本最低的”。
mysql 索引失效场景速查表
按常见失效场景分类,含错误 sql 示例、核心失效原因、可落地解决方案,附关键备注,快速避坑、优化 sql。
| 失效场景(错误 sql 示例) | 核心失效原因 | 解决方案(优化 sql / 索引) | 关键备注 |
|---|---|---|---|
索引字段做函数 / 运算select * from user where left(name,3)='张'select * from order where create_time + 1 day > now() | 函数 / 算术运算会修改索引字段的原始值,mysql 无法利用 b + 树索引的有序性做快速查找 | 1. 改写 sql,将函数 / 运算移到查询条件右侧✅ 优化后:select * from user where name like '张%'select * from order where create_time > now()-1 day2. 若无法改写,考虑生成列索引(mysql 5.7+) | 前缀匹配like '张%'可命中索引,属于特例 |
模糊查询以 % 开头select * from user where name like '%三'select * from user where name like '%张%' | %开头会破坏索引的有序性,mysql 无法通过索引定位,只能全表扫描 | 1. 业务允许则改为前缀匹配(like '张%')2. 文本模糊查询用全文索引(fulltext index)3. 大数据量文本查询,改用 elasticsearch | 全文索引适用于text/varchar大字段,替代低效的 % 模糊查询 |
索引字段存在隐式类型转换select * from user where phone=13800138000(phone 为 varchar 类型) | mysql 会对索引字段做隐式转换(如cast(phone as unsigned)),转换后字段脱离索引,触发全表扫描 | 1. 保证查询参数与字段类型一致✅ 优化后:select * from user where phone='13800138000'2. 统一数据库字段与业务代码的参数类型 | 最易踩坑的场景之一,多发生在字符串 / 数字类型混用 |
联合索引不满足最左前缀原则联合索引(user_id, create_time)select * from order where create_time between '2024-01-01' and '2024-12-31' | 联合索引的生效规则为从左到右连续匹配,跳过最左字段,后续字段无法命中索引 | 1. 补充最左前缀字段到查询条件2. 若该字段查询频繁,单独创建索引3. 调整联合索引字段顺序(将高频查询字段放左侧) | 联合索引设计原则:区分度高的字段放前,高频查询字段放前 |
or 连接非索引字段select * from user where name='张三' or age=25(name 有索引,age 无索引) | or 的查询逻辑为 “任一满足即可”,若存在非索引字段,mysql 无法通过索引过滤,直接触发全表扫描 | 1. 为所有 or 连接的字段创建索引2. 改用union/union all拆分查询(替代 or)✅ 优化后:select * from user where name='张三' union all select * from user where age=25 | union 会去重(性能略低),union all 不查重(性能更高,确认无重复时用) |
用is null/is not null查询低区分度索引字段select * from user where email is null(email 为索引字段,大量 null 值) | 索引对 null 值的过滤效率极低,若 null 值占比高,查询效率不如全表扫描 | 1. 索引字段设置not null,用默认值(如空字符串)替代 null2. 若必须存 null,改用全表扫描(强制force index()反而更慢) | 设计规范:索引字段尽量设置为 not null,从根源避免该问题 |
分页查询limit offset 过大select * from order order by create_time desc limit 10000,10 | offset 过大时,mysql 需扫描前 n 条数据并丢弃,仅返回最后 10 条,全表扫描成本高 | 1. 利用主键 / 唯一索引定位分页起点,避免全表扫描✅ 优化后:select o.* from order o where o.id < (select id from order order by create_time desc limit 10000,1) order by create_time desc limit 102. 业务上限制最大分页页数(如最多支持 100 页) | 核心思路:将偏移量分页改为主键定位分页,利用索引减少扫描行数 |
联合索引中字段顺序与排序 / 过滤矛盾联合索引(user_id, create_time)select * from order where user_id>100 order by create_time desc | 范围查询(>/<)后的索引字段无法用于排序 / 分组,只能全表排序 | 1. 调整联合索引顺序,将排序字段放范围字段前(若排序更频繁)2. 为排序字段单独创建索引3. 用覆盖索引减少回表成本 | 联合索引中:等值查询字段放前,范围查询字段放中,排序字段放最后 |
用not in/not exists查询索引字段select * from user where id not in (1,2,3) | mysql 对not in的索引支持极差,会默认走全表扫描,替代方案效率更高 | 1. 改用left join + is null替代✅ 优化后:select u.* from user u left join temp t on u.id=t.id where t.id is null2. 改用<>()逐个排除(少量值时) | not exists比not in效率略高,但仍不如left join |
补充:索引生效的「黄金规则」
- 索引字段直接作为查询条件,不做任何函数 / 运算 / 转换;
- 联合索引遵循最左前缀原则,查询条件包含从左到右的连续字段;
- 模糊查询仅前缀匹配(
like 'xxx%')可命中索引; - 查询参数与索引字段类型严格一致,避免隐式转换;
- or 连接的字段全部创建索引,否则整体失效。
快速排查技巧
- 用
explain分析 sql,type=all表示全表扫描(索引失效); - 关注
extra字段:using filesort(额外排序)、using temporary(临时表)均需优化; - 若
key=null,说明未使用任何索引,优先检查上述失效场景。
到此这篇关于mysql 索引优化实战指南(从慢查询到高性能)的文章就介绍到这了,更多相关mysql索引优化内容请搜索代码网以前的文章或继续浏览下面的相关文章希望大家以后多多支持代码网!
发表评论