本文共 2721 字,大约阅读时间需要 9 分钟。
查询优化器使用统计信息为sql选择执行计划
Mysql没有直方图信息,也无法手工删除统计信息
如何收集统计信息
Analyze table收集表和索引统计信息,适用于MyISAM和InnoDB;
对于innodb表,还可以使用以下选项
1
表第一次打开的时候
2
表修改的行超过1/16或者20亿条
./row/row0mysql.c:row_update_statistics_if_needed
3
执行show index/table或者查询information_schema.tables/statistics表时
在访问以下表时,innodb表的统计信息可自动收集
information_schema.TABLES
information_schema.STATISTICS
information_schema.PARTITIONS
information_schema.KEY_COLUMN_USAGE
information_schema.TABLE_CONSTRAINTS
information_schema.REFERENTIAL_CONSTRAINTS
information_schema.table_constraints
innodb_stats_on_metadata参数用来控制此行为,设置为false时不更新统计信息
Innodb_stats_sample_pages每次收集统计信息时采样的页数,默认为8
每个表维护一个stat_modified_counter,每次DML更新1行就加1,直到满足阈值则自动收集统计信息,并把此值清0;
函数dict_update_statistics用于更新统计信息,但若有多个线程同时检测到阈值,会导致多次调用,浪费了系统资源;
可以直接修改代码,让dict_update_statistics对stat_modified_counter加锁,避免并发执行;
5.6提供选项innodb_stats_persistent,默认on,将analyze table产生的统计信息保存于磁盘,直至下次analyze table为止,此举避免了统计信息动态更新,保证了执行计划的稳定,对于大表也节省了收集统计信息的所需资源;
除非当前sql执行计划不佳,否则不应经常analyze table收集统计信息
Innodb_stats_method和myisam_stats_method
计算统计信息时,拥有相同key prefix的行算作一个value group(类似oracle索引中的num_distinct,其值越多意味着索引选择性越好),average group size是非常重要的指标,即平均一个索引值返回的表行数,主要有两个用途:
1估算每次ref access要读取多少行
2 估算一个partial join要产生多少行 (…) join tab on tab.key = expr
由此可知,average group size越高则索引选择性越低,表基数即value group数量计算公式为N/S(N:表行数 S:average group size),可通过show index查看
除了主键,索引不可避免的会遇到Null(对于<=>操作符,NULL和Non-null被同等对待,而Null = Null则会返回false),mysql将NULL视作无穷小;
收集统计信息时,为了灵活的处理Null,InnoDB/MyISAM各引入一个参数Innodb_stats_method/myisam_stats_method,分别三个候选值:nulls_equal/nulls_unequal/nulls_ignored(其中innod_stats_method只有全局变量)
Nulls_equal:所有Null都相等,即算作一个value group;若Null过多则会导致average group size偏大
Nulls_unequal:所有Null互不相同,每个算作一个value group;如果non-null group size过大且null数量过多,此设置会拉低整体的average group size,可能导致滥用索引
Nulls_ignored:忽略Null
对于已经收集的统计信息,无法分辨其采用了那种方式;对于非InnoDB/MyISAM表,只有一种收集方式,即nulls_equal;
手工收集统计信息需要调用analyze table,但若表自上次analye至今没有任何改动,即便调用此命令实际也不会收集统计信息,需先让统计信息过期(插入一行再删除即可)
Mysql也可自动收集,诸如bulk insert/delete以及某些alter table语句均会触发
如何查看统计信息
Show index from table或查看information_schema.statistics表
Show table status或information_schema.tables表
可以配置统计信息的持久化和非持久化(非持久化:5.6之前都是这种)
相关参数:
持久化:
innodb_stats_persistent:on(1)
innodb_stats_persistent_sample_pages:20
非持久化:
innodb_stats_sample_pages:8
相关表:
mysql.innodb_index_stats
mysql.innodb_table_stats
From 5.6.6 开始,统计信息默认是持久化的(即innodb_stats_persistent=on),使用参数innodb_stats_persistent_sample_pages的值,来采样,此时非持久化的参数innodb_stats_sample_pages就无效。
From 5.6.6 开始,使用非持久化的统计信息:
1.set innodb_stats_persistent=0;
2.create|alter table stats_persistent=0;
对单个表开启:
create|alter table...STATS_PERSISTENT [=] {DEFAULT|0|1}
DEFAULT:table的统计信息是否持久化由参数 innodb_stats_persistent 决定。\
总结:From 5.6.6 开始,要么开启统计信息持久化,要么是还用以前的非持久化,二者选一。
转载地址:http://pwmfm.baihongyu.com/