MySQL 数据库优化知识总结
性能监控
show profile 查询剖析工具
1 |
|
Performance Schema 库
5.7 新提供自带监控数据库,有 87 张数据表。
使用 show processlist 查看连接
1 | show processlist; |
schema 与数据类型优化
数据类型优化
- 更小的通常更好
- 简单就好
- 整型比字符类型代价更低
- 使用MySQL自带类型而不是字符串类型还存储日期和时间
- 用整型存储IP地址
- 尽量避免 null
- 实际细则
索引优化细节
当使用索引列进行查询的时候尽量不要使用表达式,把计算放到业务层而不是数据层(表达式会导致索引失效);
尽量使用主键查询,而不是其它索引,因为主键查询不会触发回表查询,减少 IO 次数;
使用前缀索引,前缀索引可以减少空间占用;
使用索引扫描来排序;
union all,in,or 都能够使用索引,但是推荐使用 in;
范围列可以用到索引;
强制类型转换会导致全表扫描,即索引失效;
更新十分频繁,数据区分度不高的字段上不宜建立索引;
创建索引的列,不允许为 null,可能会得到不符合预期的结果(null != null);
当需要进行表连接的时候,最好不要超过三张表,因为需要 join 的字段,数据类型必须一致;
能使用 limit 的时候尽量使用 limit,减少后续查询操作(limit 1);
单表索引建议控制在 5 个以内;
单索引字段数不允许超过 5 个(组合索引字段个数);
创建索引的时候需要避免的错误概念:1、索引越多越好;2、过早优化,在不了解系统的情况下进行优化。
MySQL 执行计划
在企业的应用场景中,为了知道优化SQL语句的执行,需要查看SQL语句的具体执行过程,以加快SQL语句的执行效率。
可以使用 explain + SQL 语句来模拟优化器执行 SQL 查询语句,从而知道 MySQL 是如何处理 SQL 语句的。
执行计划中包含的信息
Column | Meaning |
---|---|
id | The SELECT identifier |
select_type | The SELECT type |
table | The table for the output row |
partitions | The matching partitions |
type | The join type |
possible_keys | The possible indexes to choose |
key | The index actually chosen |
key_len | The length of the chosen key |
ref | The columns compared to the index |
rows | Estimate of rows to be examined |
filtered | Percentage of rows filtered by table condition |
extra | Additional information |
id
select 查询的序列号,包含一组数字,表示查询中执行 select 子句或者操作表的顺序
id 号分为三种情况:
1、如果 id 相同,那么执行顺序从上到下
1 | explain select * from emp e join dept d on e.deptno = d.deptno join salgrade sg on e.sal between sg.losal and sg.hisal; |
2、如果 id 不同,如果是子查询,id 的序号会递增,id 值越大优先级越高,越先被执行
1 | explain select * from emp e where e.deptno in (select d.deptno from dept d where d.dname = 'SALES'); |
3、id 相同和不同的,同时存在:相同的可以认为是一组,从上往下顺序执行,在所有组中,id 值越大,优先级越高,越先执行
1 | explain select * from emp e join dept d on e.deptno = d.deptno join salgrade sg on e.sal between sg.losal and sg.hisal where e.deptno in (select d.deptno from dept d where d.dname = 'SALES'); |
select_type
主要用来分辨查询的类型,是普通查询还是联合查询还是子查询
select_type Value | Meaning |
---|---|
SIMPLE | Simple SELECT (not using UNION or subqueries) |
PRIMARY | Outermost SELECT |
UNION | Second or later SELECT statement in a UNION |
DEPENDENT UNION | Second or later SELECT statement in a UNION, dependent on outer query |
UNION RESULT | Result of a UNION. |
SUBQUERY | First SELECT in subquery |
DEPENDENT SUBQUERY | First SELECT in subquery, dependent on outer query |
DERIVED | Derived table |
UNCACHEABLE SUBQUERY | A subquery for which the result cannot be cached and must be re-evaluated for each row of the outer query |
UNCACHEABLE UNION | The second or later select in a UNION that belongs to an uncacheable subquery (see UNCACHEABLE SUBQUERY) |
1 | --sample:简单的查询,不包含子查询和union |
table
对应行正在访问哪一个表,表名或者别名,可能是临时表或者 union 合并结果集
1、如果是具体的表名,则表明从实际的物理表中获取数据,当然也可以是表的别名
2、表名是 derivedN 的形式,表示使用了 id 为 N 的查询产生的衍生表
3、当有 union result 的时候,表名是 union n1,n2 等的形式,n1,n2 表示参与 union 的 id
type
type 显示的是访问类型,访问类型表示我是以何种方式去访问我们的数据,最容易想的是全表扫描,直接暴力的遍历一张表去寻找需要的数据,效率非常低下,访问的类型有很多,效率从最好到最坏依次是:
system > const > eq_ref > ref > fulltext > ref_or_null > index_merge > unique_subquery > index_subquery > range > index > ALL
一般情况下,得保证查询至少达到 range 级别,最好能达到 ref
1 | --all:全表扫描,一般情况下出现这样的sql语句而且数据量比较大的话那么就需要进行优化。 |
possible_keys
显示可能应用在这张表中的索引,一个或多个,查询涉及到的字段上若存在索引,则该索引将被列出,但不一定被查询实际使用
1 | explain select * from emp,dept where emp.deptno = dept.deptno and emp.deptno = 10; |
key
实际使用的索引,如果为 null,则没有使用索引,查询中若使用了覆盖索引,则该索引和查询的 select 字段重叠。
1 | explain select * from emp,dept where emp.deptno = dept.deptno and emp.deptno = 10; |
key_len
表示索引中使用的字节数,可以通过 key_len 计算查询中使用的索引长度,在不损失精度的情况下长度越短越好。
1 | explain select * from emp,dept where emp.deptno = dept.deptno and emp.deptno = 10; |
ref
显示索引的哪一列被使用了,如果可能的话,是一个常数
1 | explain select * from emp,dept where emp.deptno = dept.deptno and emp.deptno = 10; |
rows
根据表的统计信息及索引使用情况,大致估算出找出所需记录需要读取的行数,此参数很重要,直接反应的 SQL 找了多少数据,在完成目的的情况下越少越好
1 | explain select * from emp; |
extra
包含额外的信息。
1 | --using filesort:说明mysql无法利用索引进行排序,只能利用排序算法进行排序,会消耗额外的位置 |