mysql統計資訊 概述MySQL統計資訊

2021-10-17 12:32:38 字數 2944 閱讀 7230

mysql統計資訊的儲存分為兩種,非持久化和持久化統計資訊。

一、非持久化統計資訊

非持久化統計資訊儲存在記憶體裡,如果資料庫重啟,統計資訊將丟失。有兩種方式可以設定為非持久化統計資訊:

1 全域性變數,

innodb_stats_persistent=off

2 create/alter表的引數,

stats_persistent=0

非持久化統計資訊在以下情況會被自動更新:

1 執行analyze table

2 innodb_stats_on_metadata=on情況下,執show table status, show index, 查詢 information_schema下的tables, statistics

3 啟用--auto-rehash功能情況下,使用mysql client登入

4 表第一次被開啟

5 距上一次更新統計資訊,表1/16的資料被修改

非持久化統計資訊的缺點顯而易見,資料庫重啟後如果大量表開始更新統計資訊,會對例項造成很大影響,所以目前都會使用持久化統計資訊。

二、持久化統計資訊

5.6.6開始,mysql預設使用了持久化統計資訊,即innodb_stats_persistent=on,持久化統計資訊儲存在表mysql.innodb_table_stats和mysql.innodb_index_stats。

持久化統計資訊在以下情況會被自動更新:

1 innodb_stats_auto_recalc=on

情況下,表中10%的資料被修改

2 增加新的索引

innodb_table_stats是表的統計資訊,innodb_index_stats是索引的統計資訊,各欄位含義如下:

innodb_table_stats

database_name

資料庫名

table_name

表名last_update

統計資訊最後一次更新時間

n_rows

表的行數

clustered_index_size

聚集索引的頁的數量

sum_of_other_index_sizes

其他索引的頁的數量

innodb_index_stats

database_name

資料庫名

table_name

表名index_name

索引名last_update

統計資訊最後一次更新時間

stat_name

統計資訊名

stat_value

統計資訊的值

sample_size

取樣大小

stat_description

型別說明

為更好的理解innodb_index_stats,建一張測試表做說明:

create table t1 (

a int, b int, c int, d int, e int, f int,

primary key (a, b), key i1 (c, d), unique key i2uniq (e, f)

) engine=innodb;

寫入資料如下:

檢視t1表的統計資訊,需主要關注stat_name和stat_value欄位

tat_name=size時:stat_value表示索引的頁的數量

stat_name=n_leaf_pages時:stat_value表示葉子節點的數量

stat_name=n_diff_pfxnn時:stat_value表示索引欄位上唯一值的數量,此處做一下具體說明:

1、n_diff_pfx01表示索引第一列distinct之後的數量,如primary的a列,只有乙個值1,所以index_name='primary' and stat_name='n_diff_pfx01'時,stat_value=1。

2、n_diff_pfx02表示索引前兩列distinct之後的數量,如i2uniq的e,f列,有4個值,所以index_name='i2uniq' and stat_name='n_diff_pfx02'時,stat_value=4。

3、對於非唯一索引,會在原有列之後加上主鍵索引,如index_name='i1' and stat_name='n_diff_pfx03',在原索引列c,d後加了主鍵列a,(c,d,a)的distinct結果為2。

了解了stat_name和stat_value的具體含義,就可以協助我們排查sql執行時為什麼沒有使用合適的索引,例如某個索引n_diff_pfxnn的stat_value遠小於實際值,查詢優化器認為該索引選擇度較差,就有可能導致使用錯誤的索引。

三、統計資訊不準確的處理

我們檢視執行計畫,發現未使用正確的索引,如果是innodb_index_stats中統計資訊差別較大引起,可通過以下方式處理:

1、手動更新統計資訊,注意執行過程中會加讀鎖:

analyzetable table_name;

2、如果更新後統計資訊仍不準確,可考慮增加表取樣的資料頁,兩種方式可以修改:

a) 全域性變數innodb_stats_persistent_sample_pages,預設為20;

b) 單個表可以指定該錶的取樣:

alter table table_name stats_sample_pages=40;

經測試,此處stats_sample_pages的最大值是65535,超出會報錯。

目前mysql並沒有提供直方圖的功能,某些情況下(如資料分布不均)僅僅更新統計資訊不一定能得到準確的執行計畫,只能通過index hint的方式指定索引。新版本8.0會增加直方圖功能,讓我們期待mysql越來越強大的功能吧!

MySQL統計資訊簡介

mysql統計資訊的儲存分為兩種,非持久化和持久化統計資訊。一 非持久化統計資訊 非持久化統計資訊儲存在記憶體裡,如果資料庫重啟,統計資訊將丟失。有兩種方式可以設定為非持久化統計資訊 非持久化統計資訊在以下情況會被自動更新 非持久化統計資訊的缺點顯而易見,資料庫重啟後如果大量表開始更新統計資訊,會對...

MySQL統計資訊相關表介紹

相信大家都了解mysql中的統計資訊,那麼統計資訊是存放在 呢?我們怎麼去檢視?這個表裡面的內容還是比較好理解。重要的列 通過這些資訊我們可以算出聚集索引的大小 這個表裡面輸出的內容相對會比較複雜一些。表結構和測試資料 我們主要關注的的列 1 主鍵索引與唯一索引 例如上面結果中index name ...

mysq 全表累加統計 分組累加統計

mysql 全表累加統計 實現思路 1 定義使用者變數,設定初始值 2 累加賦值,所求值作為顯示列 select create time,total num,total num 0,total num total num stn as stn from select create time,tota...