• 首页
        • 更多产品

          客户为中心的产品管理工具

          专业的软件研发项目管理工具

          简单易用的团队知识库管理

          可量化的研发效能度量工具

          测试用例维护与计划执行

          以团队为中心的协作沟通

          研发工作流自动化工具

          账号认证与安全管理工具

          Why PingCode
          为什么选择 PingCode ?

          6000+企业信赖之选,为研发团队降本增效

        • 行业解决方案
          先进制造(即将上线)
        • 解决方案1
        • 解决方案2
  • Jira替代方案
目录

为什么mysql innodDB中组合索引中范围查询后的条件索引会失效

mysql innodDB中组合索引中范围查询后的条件索引会失效的原因:范围查询操作时MySQL需要对组合索引中的非范围查询条件逐个进行检查,由于范围查询操作不连续,会超过MySQL的最大行数限制,导致MySQL放弃使用这个组合索引。

一、mysql innodDB中组合索引中范围查询后的条件索引会失效的原因

表建立联合索引(a,b,c),查询条件a=1,b>2,c=3,此时c条件的索引会失效。简单点来说,该组合索引是一个以a字段排序而b与c相对有序的B+树,引擎可以通过二分查找定位到a=1的数据,b在a=1确定得情况下是有序的(所以b的有序是相对的),依然可以通过二分查找取出所有b大于2的数据,但这些数据的b字段可能有很多个不同的值,所以c字段是无序的,无法用二分查找来查询c=3的数据,故c用不到索引。

当进行范围查询操作时,MySQL需要对组合索引中的非范围查询条件逐个进行检查,以过滤掉不符合要求的记录,直至扫描到范围查询条件时,由于范围查询操作具有不连续的特点,因此这个范围查询条件之后的记录数据量会变得非常大,通常会超过MySQL的最大行数限制,这就导致了MySQL放弃使用这个组合索引,而改为全表扫描(full table scan)来获取结果。这也是为什么范围查询操作容易导致MySQL查询性能降低的原因之一。

例如存在索引数据如:(a=1,b=3,c=3),(a=1,b=4,c=0),(a=1,b=4,c=3),(a=1,b=4,c=0)。上述数据均满足a=1&b>2,但是c的数据却不是连续的,所以没有办法通过c索引进行过滤,所以字段c并不能够参与到索引刷选中。

二、组合索引

1、组合索引的使用

本文中组合索引的定义为(MySQL):

ALTER TABLE table_name ADD INDEX (col1,col2,col3);

2、组合索引的本质

当创建(col1,col2,col3)组合索引时,相当于创建了(col)单列索引,(clo1,clo2)组合索引以及(col1,col2,col3)组合索引想要索引生效,只能使用col1和col1,col2和col1,col2,col3三种组合;当然,col1,col3组合也可以,但实际上只用到了col1的索引,col3并没有用到。

3、示例

组合索引相当于一个按照姓氏——名字的一个电话簿,只能先确定姓氏才可以命中索引,下列可以正确命中组合索引的语句( = 和IN直接的字段都可以乱序,MySQL的查询优化器可以优化成索引识别的形式)

使用到索引的情况如下:

col_a = "some value"

col_a = "some value" and col_b = "some value"

col_a = "some value" and col_c = "some value"

col_a = "some value" and col_b = "some value" and col_c = "some value"

col_a = "some value" and col_c = "some value" and col_b = "some value"

col_b = "some value" and col_a = "some value" and col_c = "some value"

col_b = "some value" and col_c = "some value" and col_a = "some value"

col_c = "some value" and col_a = "some value" and col_b = "some value"

col_c = "some value" and col_b = "some value" and col_a = "some value"

未使用索引的情况:

col_b = "some value"

col_c = "some value"

col_b = "some value" and col_c = "some value"

col_c = "some value" and col_b = "some value"

总结,组合索引从最左开始组合,只要包含名列前茅列的查询都会用到该组合索引。

4、为什么要使用组合索引

  • 减少开销:建一个联合索引(col1,col2,col3),实际相当于建了(col1),(col1,col2),(col1,col2,col3)三个索引。每多一个索引,都会增加写操作的开销和磁盘空间的开销。对于大量数据的表,使用组合索引会大大的减少开销。
  • 覆盖索引:对组合索引(col1,col2,col3),如果有如下的sql: select col1,col2,col3 from test where col1=1 and col2=2。那么MySQL可以直接通过遍历索引取得数据,而无需回表,这减少了很多的随机io操作。减少io操作,特别的随机io其实是dba主要的优化策略。所以,在真正的实际应用中,覆盖索引是主要的提升性能的优化手段之一。
  • 效率高:索引列越多,通过索引筛选出的数据越少。

5、SQL中组合索引和普通索引区别

组合索引中列的顺序非常重要,从左原则:a,ab,ba,abc。

单个索引:一个一个起作用,也就是说有三个单个索引,哪个条件查询在前哪个起作用,其他不起作用。

结论

一般来说,列表搜索需要多个列查询,此时就可以使用联合索引,都是and的关系。什么时候需要创建索引:

  • where条件会经常出现的,并且当前表的数量比较大。
  • where条件中是用and而非or的时候。
  • 组合索引比单个索引更适合,因为索引占用一定磁盘空间,也就说明有一定的开销,如果多个单个索引比较多,那么多资源的浪费也比较多,组合索引相当于对多个列建索引,并且只建一次,and条件下非常适合。

延伸阅读1:MySQL简介

MySQL是一个关系型数据库管理系统,由瑞典MySQL AB 公司开发,属于 Oracle 旗下产品。MySQL 是最流行的关系型数据库管理系统之一,在 WEB 应用方面,MySQL是较好的 RDBMS (Relational Database Management System,关系数据库管理系统) 应用软件之一。

相关文章