重点
平时进行 sql 调优,主要是通过观察慢 sql,然后利用 explain 分析查询语句的执行计划,识别性能瓶颈,优化查询语句。
1) 合理设计索引,利用联合索引进行覆盖索引的优化,避免回表的发生,减少一次查询和随机 i/o
- 回表:索引无法满足查询所需的所有列数据,需要回到主表获取额外的数据。
- 避免回表:创建覆盖索引(索引包含了查询所需的所有列),让查询可以直接从索引中获取所有数据,无需访问主表。
例子:
建表和建立索引:
create table user ( id int primary key, name varchar(50), age int, gender char(1), city varchar(50) ); create index idx_name_age_gender on user(name, age, gender);
- 建立了联合索引:
name
,age
,gender
。
若执行select city from user where name = 'john' and age = 25;
因为 select
需要 返回city
。 索引中没有city
列的数据,还需要根据索引条目中包含的主键信息(虽然例子中没有显式指定,但通常索引会包含指向主键的指针)回到 user 表的主键索引中,去查找完整的行数据,这个“回到主表查找 city 列”的过程就是回表 。
2) 避免 select *,只查询必要的字段
3) 避免在 sql 中进行函数计算等操作,使得无法命中索引
4) 避免使用 %like,导致全表扫描
5) 注意联合索引需满足最左匹配原则
解释最左匹配原则:最左匹配原则是指在使用联合索引时,必须按照索引的顺序从左到右使用,不能跳过索引中的列。
1. sql 实战理解 最左匹配原则建表语句:假设我们有一个用户订单表,包含用户id、订单日期和订单金额三个字段,我们对这三个字段创建一个联合索引。
create table user_orders ( id int auto_increment primary key, user_id int, order_date date, order_amount decimal(10,2), index idx_user_date_amount (user_id, order_date, order_amount) );
python脚本生成测试数据:
from datetime import datetime, timedelta import random # 生成insert语句 def generate_insert_statements(): start_date = datetime(2023, 1, 1) statements = [] for _ in range(4200): user_id = random.randint(1, 1000) days = random.randint(0, 365) order_date = (start_date + timedelta(days=days)).strftime('%y-%m-%d') order_amount = round(random.uniform(10.0, 1000.0), 2) insert_sql = f"insert into user_orders (user_id, order_date, order_amount) values ({user_id}, '{order_date}', {order_amount});" statements.append(insert_sql) # 将所有insert语句写入文件 with open('insert_data.sql', 'w') as f: f.write('\n'.join(statements)) print("insert语句已生成到 insert_data.sql 文件中") if __name__ == "__main__": generate_insert_statements()
测试不同查询场景:
-- 完全满足最左匹配原则(使用全部索引列) explain select * from user_orders where user_id = 100 and order_date = '2023-05-01' and order_amount = 500;
-- 满足最左匹配原则(使用索引的前两列) explain select * from user_orders where user_id = 100 and order_date = '2023-05-01';
explain 结果:
-- 满足最左匹配原则(只使用第一列) explain select * from user_orders where user_id = 100;
explain 结果:
-- 不满足最左匹配原则(跳过`user_id`) explain select * from user_orders where order_date = '2023-05-01' and order_amount = 500;
explain 结果:
-- 不满足最左匹配原则(只使用order_date) explain select * from user_orders where order_date = '2023-05-01';
explain 结果:
-- 不满足最左匹配原则(只使用order_amount) explain select * from user_orders where order_amount = 500;
explain 结果:
- 从上述explain 的结果看出,不满足最左匹配原则,
filitered
都很低。
6) 不要对无索引字段进行排序操作
强制使用文件排序(filesort):
当对无索引字段排序时,mysql无法利用索引的有序性,必须将数据加载到内存中进行排序,这就是filesort,filesort是一个非常耗费资源的操作。内存开销大
如果排序数据量小,mysql会在内存中完成排序,如果数据量超过sort_buffer_size,会发生磁盘文件排序,磁盘排序涉及临时文件的创建和多次io,性能更差!
sql实战演示
-- 创建测试表 create table worker( id int auto_increment primary key, name varchar(50), salary decimal(10,2), department varchar(50), index idx_salary (salary) -- 只对salary创建索引 ); -- 插入测试数据 insert into worker(name, salary, department) values ('张三', 5000, '技术部'), ('李四', 6000, '市场部'), ('王五', 4500, '技术部'), ('赵六', 7000, '销售部');
-- 会使用索引排序的情况: -- 只查询索引列 select salary from employees order by salary; -- 或者 select id, salary from employees order by salary; -- 结果显示: using index for order by
会导致filesort的情况: -- 特例:查询所有列(select *) select * from employees order by salary;
- 当使用
select *
时,需要回表获取所有列的数据,这种情况下,mysql认为使用索引排序的成本比filesort更高。
-- 对无索引的department字段排序 explain select * from employees order by department; -- 结果显示: using filesort
7) 连表查询需要注意不同字段的字符集是否一致,否则也会导致全表扫描
除此之外,还可以利用缓存来优化,一些变化少或者访问频繁的数据设置到缓存中,减轻数据库的压力,提升查询的效率。
还可以通过业务来优化,例如少展示一些不必要的字段,减少多表查询的情况,将列表查询替换成分页分批查询等等。
总结
到此这篇关于mysql中如何进行sql调优的文章就介绍到这了,更多相关mysql进行sql调优内容请搜索代码网以前的文章或继续浏览下面的相关文章希望大家以后多多支持代码网!
发表评论