六月 | 2016 | PHP技术网

MYSQL之EXPLAIN语法详解

2016 年 6 月 27 日 at 下午 4:04分类:Mysql

如果在SELECT语句前放上关键词EXPLAIN，MySQL将解释它如何处理SELECT，
提供有关表如何联接和联接的次序。借助于EXPLAIN，
可以知道什么时候必须为表加入索引以得到一个使用索引来寻找记录的更快的SELECT。

EXPLAIN SELECT * FROM tables where……

借助于EXPLAIN，可以知道什么时候必须为表加入索引以得到一个使用索引来寻找记录的更快的SELECT。
还可以知道优化器是否以一个最佳次序联接表。为了强制优化器让一个SELECT语句按照表命名顺序的联接次序，语句应以STRAIGHT_JOIN而不只是SELECT开头。
EXPLAIN为用于SELECT语句中的每个表返回一行信息。表以它们在处理查询过程中将被MySQL读入的顺序被列出。MySQL用一遍扫描多次联接（single-sweep multi-join）的方式解决所有联接。这意味着MySQL从第一个表中读一行，然后找到在第二个表中的一个匹配行，然后在第3个表中等等。当所有的表处理完后，它输出选中的列并且返回表清单直到找到一个有更多的匹配行的表。从该表读入下一行并继续处理下一个表。
当使用EXTENDED关键字时，EXPLAIN产生附加信息，可以用SHOW WARNINGS浏览。该信息显示优化器限定SELECT语句中的表和列名，重写并且执行优化规则后SELECT语句是什么样子，并且还可能包括优化过程的其它注解。

EXPLAIN的每个输出行提供一个表的相关信息，并且每个行包括下面的列：
id：SELECT识别符。这是SELECT的查询序列号。
select_type：SELECT类型。
1、SIMPLE：简单SELECT(不使用UNION或子查询)
2、PRIMARY：最外面的SELECT
3、UNION：UNION中的第二个或后面的SELECT语句
4、DEPENDENT UNION：UNION中的第二个或后面的SELECT语句，取决于外面的查询
5、UNION RESULT：UNION的结果
6、SUBQUERY：子查询中的第一个SELECT
7、DEPENDENT SUBQUERY：子查询中的第一个SELECT，取决于外面的查询
8、DERIVED：导出表的SELECT(FROM子句的子查询)
table：表名
type：联接类型
1、system：表仅有一行(=系统表)。这是const联接类型的一个特例。
2、const：表最多有一个匹配行，它将在查询开始时被读取。因为仅有一行，在这行的列值可被优化器剩余部分认为是常数。const用于用常数值比较PRIMARY KEY或UNIQUE索引的所有部分时。
3、eq_ref：对于每个来自于前面的表的行组合，从该表中读取一行。这可能是最好的联接类型，除了const类型。它用在一个索引的所有部分被联接使用并且索引是UNIQUE或PRIMARY KEY。eq_ref可以用于使用= 操作符比较的带索引的列。比较值可以为常量或一个使用在该表前面所读取的表的列的表达式。
4、ref：对于每个来自于前面的表的行组合，所有有匹配索引值的行将从这张表中读取。如果联接只使用键的最左边的前缀，或如果键不是UNIQUE或PRIMARY KEY（换句话说，如果联接不能基于关键字选择单个行的话），则使用ref。如果使用的键仅仅匹配少量行，该联接类型是不错的。ref可以用于使用=或<=>操作符的带索引的列。
5、ref_or_null：该联接类型如同ref，但是添加了MySQL可以专门搜索包含NULL值的行。在解决子查询中经常使用该联接类型的优化。
6、index_merge：该联接类型表示使用了索引合并优化方法。在这种情况下，key列包含了使用的索引的清单，key_len包含了使用的索引的最长的关键元素。
7、unique_subquery：该类型替换了下面形式的IN子查询的ref：value IN (SELECT primary_key FROMsingle_table WHERE some_expr);unique_subquery是一个索引查找函数，可以完全替换子查询，效率更高。
8、index_subquery：该联接类型类似于unique_subquery。可以替换IN子查询，但只适合下列形式的子查询中的非唯一索引：value IN (SELECT key_column FROM single_table WHERE some_expr)
9、 range：只检索给定范围的行，使用一个索引来选择行。key列显示使用了哪个索引。key_len包含所使用索引的最长关键元素。在该类型中ref列为NULL。当使用=、<>、>、>=、<、<=、IS NULL、<=>、BETWEEN或者IN操作符，用常量比较关键字列时，可以使用range
10、index：该联接类型与ALL相同，除了只有索引树被扫描。这通常比ALL快，因为索引文件通常比数据文件小。
11、all：对于每个来自于先前的表的行组合，进行完整的表扫描。如果表是第一个没标记const的表，这通常不好，并且通常在它情况下很差。通常可以增加更多的索引而不要使用ALL，使得行能基于前面的表中的常数值或列值被检索出。
possible_keys：possible_keys列指出MySQL能使用哪个索引在该表中找到行。注意，该列完全独立于EXPLAIN输出所示的表的次序。这意味着在possible_keys中的某些键实际上不能按生成的表次序使用。
key：key列显示MySQL实际决定使用的键（索引）。如果没有选择索引，键是NULL。要想强制MySQL使用或忽视possible_keys列中的索引，在查询中使用FORCE INDEX、USE INDEX或者IGNORE INDEX。
key_len：key_len列显示MySQL决定使用的键长度。如果键是NULL，则长度为NULL。注意通过key_len值我们可以确定MySQL将实际使用一个多部关键字的几个部分。
ref：ref列显示使用哪个列或常数与key一起从表中选择行。
rows：rows列显示MySQL认为它执行查询时必须检查的行数。
Extra：该列包含MySQL解决查询的详细信息。
1、Distinct：MySQL发现第1个匹配行后，停止为当前的行组合搜索更多的行。
2、Not exists：MySQL能够对查询进行LEFT JOIN优化，发现1个匹配LEFT JOIN标准的行后，不再为前面的的行组合在该表内检查更多的行。
3、range checked for each record (index map: #)：MySQL没有发现好的可以使用的索引，但发现如果来自前面的表的列值已知，可能部分索引可以使用。对前面的表的每个行组合，MySQL检查是否可以使用range或index_merge访问方法来索取行。
4、Using filesort：MySQL需要额外的一次传递，以找出如何按排序顺序检索行。通过根据联接类型浏览所有行并为所有匹配WHERE子句的行保存排序关键字和行的指针来完成排序。然后关键字被排序，并按排序顺序检索行。
5、Using index：从只使用索引树中的信息而不需要进一步搜索读取实际的行来检索表中的列信息。当查询只使用作为单一索引一部分的列时，可以使用该策略。
6、Using temporary：为了解决查询，MySQL需要创建一个临时表来容纳结果。典型情况如查询包含可以按不同情况列出列的GROUP BY和ORDER BY子句时。
7、Using where：WHERE子句用于限制哪一个行匹配下一个表或发送到客户。除非你专门从表中索取或检查所有行，如果Extra值不为Using where并且表联接类型为ALL或index，查询可能会有一些错误。
8、Using sort_union(…), Using union(…), Using intersect(…)：这些函数说明如何为index_merge联接类型合并索引扫描。
9、Using index for group-by：类似于访问表的Using index方式，Using index for group-by表示MySQL发现了一个索引，可以用来查询GROUP BY或DISTINCT查询的所有列，而不要额外搜索硬盘访问实际的表。并且，按最有效的方式使用索引，以便对于每个组，只读取少量索引条目。
通过相乘EXPLAIN输出的rows列的所有值，你能得到一个关于一个联接如何的提示。这应该粗略地告诉你MySQL必须检查多少行以执行查询。当你使用max_join_size变量限制查询时，也用这个乘积来确定执行哪个多表SELECT语句。

mysql 索引的一些事

2016 年 6 月 22 日 at 下午 4:18分类:Mysql

索引是什么
索引相当于一本书的目录数据就是书里面的正文内容
想要快速的找到自己的想要的章节就先查看目录再找到对应的页面
如果没有索引就相当于从第一页开始找一样。

索引越多越好吗？
数据的变更(增删改)都需要维护索引，因此更多的索引意味着更多的维护成本
更多的索引意味着更多的空间（100页书 50页目录不合理）
过小的表建立索引会更慢（2页书还建立目录吗？）

索引的字段类型问题
text类型，也可建索引(需指定长度)
myisam存储引擎索引键长度综合不能超过1000字节
用来筛选的值尽量保持和索引列同样的数据类型

怎么才能用到索引
以下操作符也可用到索引：
<,<=,=,>,>=,BETWEEN,IN
like也可以用到索引，尽量减少like，”xxx%” 是可以用到索引的，“%xxx %xxx%”这两种是用不到索引的

<>,not in,!=则不行
对列进行函数运算的情况（如 where md5(password) = “xxxx”）
WHERE index=1 OR a=10
存了数值的字符串类型字段（如手机号），查询时记得不要丢掉值的引号，否则无法用到该字段相关索引，反之则没关系
select * from test where mobile = 13312345678;
可是无法用到mobile字段的索引的哦（如果mobile是char 或 varchar类型的话）

*一次查询不能用多个索引*

什么样的字段不适合建索引？
一般来说，列的值唯一性太小（如性别，类型什么的），
不适合建索引（怎样叫太小？一半说来，同值的数据超过表的百分之15，那就没必要建索引了）
太长的列，可以选择只建立部分索引,(如:只取前十位做索引)
更新非常频繁的数据不适宜建索引

多列查询该如何建索引?
一次查询只能用到一个索引，所以首先否定a,b各建索引方案
a还是b？谁的同值的最少,建谁
当然，联合索引也是个不错的方案，ab，还是ba，则同上，区分度高者，在前

联合索引的问题
where a = “xxx” 可以使用 ab 联合索引
where b = “xxx” 则不可
所以，大多数情况下，有ab索引了，就可以不用在去建一个A索引了

覆盖索引(Covering Indexes)拥有更高效率
索引包含了所需的全部值的话，就只select 他们，换言之，只select需要用到的字段，
如无必要，可尽量避免select *

NULL 的问题
NULL会导致索引形同虚设，所以在设计表结构时应避免NULL的存在（用其他方式表达你想表达的NULL，比如 -1,0）

如何查看索引信息，如何分析是否正确用到索引
show index from tablename;
explain select …