Mysql學習專欄之一（Mysql基礎架構）

mysql 可以分為server 層和儲存引擎層兩部分，如下圖所示：

server 層包括聯結器、查詢快取、分析器、優化器、執行器等，涵蓋 mysql 的大多數核心服務功能，以及所有的內建函式（如日期、時間、數學和加密函式等），所有跨儲存引擎的功能都在這一層實現，比如儲存過程、觸發器、檢視等。

而儲存引擎層負責資料的儲存和提取。其架構模式是外掛程式式的，支援 innodb、myisam、memory 等多個儲存引擎。現在最常用的儲存引擎是 innodb，它從mysql 5.5.5版本開始成為了預設儲存引擎。

接下來，我們對server 層的各個部分進行詳細介紹。

聯結器負責跟客戶端建立連線、獲取許可權、維持和管理連線。

1.建立連線

建立連線的mysql命令為：

mysql -h$ip -p$port -u$user -p

輸完命令之後，就需要在互動對話裡面輸入密碼。雖然密碼也可以直接跟在 -p 後面寫在命令列中，但這樣可能會導致你的密碼洩露（比如通過history直接就可以檢視到之前輸入的密碼）。如果你連的是生產伺服器，強烈建議你不要這麼做。

2.獲取許可權

建立連線後，聯結器就要開始進行身份認證，這個時候用的就是我們輸入的使用者名稱和密碼。

如果使用者名稱或密碼不對，你就會收到乙個"access denied for user"的錯誤，然後客戶端程式結束執行。如果使用者名稱密碼認證通過，聯結器會到許可權表裡面查出你擁有的許可權。之後，這個連線裡面的許可權判斷邏輯，都將依賴於此時讀到的許可權。

這就意味著，乙個使用者成功建立連線後，即使你用管理員賬號對這個使用者的許可權做了修改，也不會影響已經存在連線的許可權。修改完成後，只有再新建的連線才會使用新的許可權設定。

3.維持和管理連線

連線完成後，如果沒有後續的動作，這個連線就處於空閒狀態，可以通過show processlist命令檢視連線情況，如下圖所示：

其中的 command 列顯示為「sleep」的行，代表的是現在系統裡面的空閒連線。客戶端如果太長時間沒動靜，聯結器就會自動將它斷開。

資料庫裡面，有長連線和短連線的概念。

長連線：是指連線成功後，如果客戶端持續有請求，則一直使用同乙個連線。

短連線：是指每次執行完很少的幾次查詢就斷開連線，下次查詢再重新建立乙個。

建立連線的過程通常是比較複雜的，所以在使用中要儘量減少建立連線的動作，也就是盡量使用長連線。

但是全部使用長連線後，你可能會發現，有些時候 mysql 占用記憶體漲得特別快，這是因為 mysql 在執行過程中臨時使用的記憶體是管理在連線物件裡面的,這些資源會在連線斷開的時候才釋放。所以如果長連線累積下來，可能導致記憶體占用太大，被系統強行殺掉（oom），從現象看就是 mysql 異常重啟了。

解決方案就是定期斷開長連線。使用一段時間，或者程式裡面判斷執行過乙個占用記憶體的大查詢後，斷開連線，之後要查詢再重連。如果你用的是 mysql 5.7 或更新版本，可以在每次執行乙個比較大的操作後，通過執行mysql_reset_connection來重新初始化連線資源。這個過程不需要重連和重新做許可權驗證，但是會將連線恢復到剛剛建立完時的狀態。

mysql對之前執行過的語句及其結果，會以 key-value 對的形式直接快取到記憶體中，key 是查詢的語句，value 是查詢的結果。

當拿到乙個查詢請求後，會先到查詢快取看看，之前是不是執行過這條語句。

如果你的查詢能夠直接在這個快取中找到 key，那麼這個 value 就會被直接返回給客戶端。mysql 不需要執行後面的複雜操作，就可以直接返回結果，這個效率會很高。

如果語句不在查詢快取中，就會繼續後面的執行階段。執行完成後，執行結果會被存入查詢快取中。

實際上，查詢快取的失效非常頻繁，只要有對乙個表的更新，這個表上所有的查詢快取都會被清空。因此對於更新壓力大的資料庫來說，查詢快取的命中率會非常低。除非你的業務就是有一張靜態表，很長時間才會更新一次。比如，乙個系統配置表，那這張表上的查詢才適合使用查詢快取。

如果沒有命中查詢快取，就要開始真正執行語句了。首先，mysql 需要知道你要做什麼，因此需要對 sql 語句做解析。

分析器先會做「詞法分析」。你輸入的是由多個字串和空格組成的一條 sql 語句，mysql 需要識別出裡面的字串分別是什麼，代表什麼。mysql 從你輸入的"select"這個關鍵字識別出來，這是乙個查詢語句。它也要把字串「t」識別成「表名 t」，把字串「id」識別成「列 id」。

做完了這些識別以後，就要做「語法分析」。根據詞法分析的結果，語法分析器會根據語法規則，判斷你輸入的這個 sql 語句是否滿足 mysql 語法。

經過分析器，mysql 就知道你要做什麼了。在開始執行之前，還要先經過優化器的處理。

優化器是在表裡面有多個索引的時候，決定使用哪個索引；或者在乙個語句有多表關聯（join）的時候，決定各個表的連線順序。

比如你執行下面這樣的語句，這個語句是執行兩個表的 join：

mysql> select * from t1 join t2 using(id)  where t1.c=10 and t2.d=20;

既可以先從表 t1 裡面取出 c=10 的記錄的 id 值，再根據 id 值關聯到表 t2，再判斷 t2 裡面 d 的值是否等於 20。

也可以先從表 t2 裡面取出 d=20 的記錄的 id 值，再根據 id 值關聯到 t1，再判斷 t1 裡面 c 的值是否等於 10。

這兩種執行方法的邏輯結果是一樣的，但是執行的效率會有不同，而優化器的作用就是決定選擇使用哪乙個方案。優化器階段完成後，這個語句的執行方案就確定下來了，然後進入執行器階段。

mysql 通過分析器知道了你要做什麼，通過優化器知道了該怎麼做，於是就進入了執行器階段，開始執行語句。

開始執行的時候，要先判斷一下你對這個表 t 有沒有執行查詢的許可權，如果沒有，就會返回沒有許可權的錯誤，如下所示 (在工程實現上，如果命中查詢快取，會在查詢快取返回結果的時候，做許可權驗證。查詢也會在優化器之前呼叫 precheck 驗證許可權)。

mysql> select * from t where id=10;
error 1142 (42000): select command denied to user 'b'@'localhost' for table 't'

如果有許可權，就開啟表繼續執行。開啟表的時候，執行器就會根據表的引擎定義，去使用這個引擎提供的介面。

比如我們這個例子中的表 t 中，如果id 字段沒有索引，那麼執行器的執行流程是這樣的：

1. 呼叫 innodb 引擎介面取這個表的第一行，判斷 id 值是不是 10，如果不是則跳過，如果是則將這行存在結果集中；

2. 呼叫引擎介面取「下一行」，重複相同的判斷邏輯，直到取到這個表的最後一行；

3. 執行器將上述遍歷過程中所有滿足條件的行組成的記錄集作為結果集返回給客戶端。

至此，這個語句就執行完成了。

對於有索引的表，執行的邏輯也差不多。第一次呼叫的是「取滿足條件的第一行」這個介面，之後迴圈取「滿足條件的下一行」這個介面，這些介面都是引擎中已經定義好的。

你會在資料庫的慢查詢日誌中看到乙個 rows_examined 的字段，表示這個語句執行過程中掃瞄了多少行。這個值就是在執行器每次呼叫引擎獲取資料行的時候累加的。

在有些場景下，執行器呼叫一次，在引擎內部則掃瞄了多行，因此引擎掃瞄行數跟 rows_examined 並不是完全相同的。

Mysql學習專欄之一（Mysql基礎架構）

MySQL學習之（一）建立MySQL

MySQL學習筆記之一 MySQL入門

MySQL學習筆記之一MySQL入門

Mysql學習專欄之一（Mysql基礎架構）

MySQL學習之（一）建立MySQL

MySQL學習筆記之一 MySQL入門

MySQL學習筆記之一MySQL入門

相關推薦