MySQL EXPLAIN 解説

MySQL EXPLAIN 解説 2023-08-25 新卒講義（株）インフィニットループ事業基盤マネージャー波多野信広

内容 • EXPLAIN で出力される実行計画の解説 • ota さん資料 https://www.infiniteloop.co.jp/tech-blog/2011/03/mysql-index-explain/ の EXPLAIN
のパートを補完 • EXPLAIN のさらなる詳細は本家リファレンス・マニュアルの「8.8.2 EXPLAIN 出力フォーマット」にてhttps://dev.mysql.com/doc/refman/8.0/ja/explain-output.html

EXPLAIN を読む上で、理解しやすくなるポイント MySQL は SQL を理解し実行する SQL のレイヤーとトランザクショナル Key Value
Store (KVS) の InnoDB ストレージエンジンとの２層構造ざっくり言うと SQL を単純な InnoDB 操作へとコンパイルしたものが実行計画 MySQL InnoDB SELECT * FROM t1 INNER JOIN t2 ON t1.pkey = t2.pkey HANDLER t1 READ pkey HANDLER t2 READ pkey 積集合

EXPLAIN を読む上で、理解しやすくなるポイント MySQL (InnoDB) のテーブル構造は、全てのインデックスがプライマリキーへの参照になっている「クラスター・インデックス」「索引編成表」 pkey ・・・ ix1 ・・・
ix2 ix1 pkey ix2 pkey インデックスでは pkey が value プライマリキー（テーブル）では pkey 以外の全てが１個の value インデックスマージ AND 積集合 = 共通 pkey 抽出 OR 和集合 = 両方の pkey 抽出 ix1ix2 pkey 複合インデックスインデックスにあるか？など pkey 不要なアクセス = カバリングインデックス

EXPLAIN を読む上で、理解しやすくなるポイント JOIN には単純なネステッド・ループを使います INNER JOIN で２つの列の同値を探す場合、人間の感覚では２つ並べて交互に比較しますが・・・ 1 2 3
4 1 2 4 8 ２つのクエリを同時に読み進めながら比較同じ値ありとなし残念ながらこうはやってない

EXPLAIN を読む上で、理解しやすくなるポイント左の１行ごとに、右のテーブルを毎回スキャンして愚直に INNER JOIN を解決 1 2 3 4
1 2 4 8 多段の for ループで Join Nested Loop Join (NLJ) これ JOIN ですが、何かに似てませんか？左の値に関して右でクエリする、そう・サブクエリです！ JOIN = サブクエリなんだ！

EXPLAIN を読む上で、理解しやすくなるポイント SELECT文の評価順序 https://qiita.com/suzukito/items/edcd00e680186f2930a8 1. FROM 2. ON 3. JOIN
4. WHERE 5. GROUP BY 6. HAVING 7. SELECT 8. DISTINCT 9. ORDER BY 10. LIMIT 一つのサブクエリ内での評価順どの RDB でもだいたい同じ • アクセスするテーブルを用意して • WHERE でフィルタしながら値を得て • JOIN する • GROUP BY の集合や集約の計算 • 最後にレポート列の整形やソート

ota さん資料拝借

EXPLAIN の id, select_type, table 補足 • id : サブクエリ
select 毎に振られる番号（と思って ok） ◦ JOIN は同じ id で実行 ◦ 無関係なクエリだと id が変わる • select_type: ◦ id が変わる select_type ▪ UNION UNION ALL はクエリとして完全独立 ▪ UNION RESULT UNION の重複削除して結果を結合するフェーズ ▪ SUBQUERY SELECT の列選択にサブクエリが埋め込まれている ▪ DERIVED サブクエリ結果が派生したテーブルとして利用されている ▪ DEPENDENT 〜上のレベルのクエリのデータに依存して結果が変わる ▪ UNCACHEABLE 〜サブクエリの繰り返し時にキャッシュ利用出来てない ◦ JOIN で同じ id が使われる select_type ▪ SIMPLE 関係したサブクエリを含まない ▪ PRIMARY サブクエリを含む場合のトップレベルクエリ

UNION, UNION RESULT mysql> EXPLAIN SELECT * FROM T1 UNION
ALL SELECT * FROM T2; +----+-------------+-------+- | id | select_type | table | +----+-------------+-------+- | 1 | PRIMARY | T1 | | 2 | UNION | T2 | +----+-------------+-------+- mysql> EXPLAIN SELECT * FROM T1 UNION SELECT * FROM T2; +----+--------------+------------+- | id | select_type | table | +----+--------------+------------+- | 1 | PRIMARY | T1 | | 2 | UNION | T2 | | 3 | UNION RESULT | <union1,2> | +----+--------------+------------+- T1 の SELECT は後続の SELECT の値を結合するということで SIMPLE ではなく PRIMARY 重複削除の UNION RESULT 物理テーブルではない生成したテーブル <”union” “id”> で表記

SUBQUERY mysql> EXPLAIN SELECT *, (SELECT id FROM T2 WHERE
id = 1) FROM T1; +----+-------------+-------+- | id | select_type | table | +----+-------------+-------+- | 1 | PRIMARY | T1 | | 2 | SUBQUERY | T2 | +----+-------------+-------+- ここがテーブル T2 にアクセスする SUBQUERY

DERIVED mysql> EXPLAIN SELECT * FROM (SELECT id FROM T1
LIMIT 2) D1 WHERE D1.id > 5; +----+-------------+------------+- | id | select_type | table | +----+-------------+------------+- | 1 | PRIMARY | <derived2> | | 2 | DERIVED | T1 | +----+-------------+------------+- id 1: 後続のクエリが生成する派生テーブル <derived”id”> へのクエリ id 2: 派生テーブルを生成するクエリ

DEPENDENT SUBQUERY mysql> EXPLAIN SELECT *, (SELECT id FROM T1
WHERE T1.id = D2.id) D1 FROM (SELECT id FROM T2 LIMIT 2) D2; +----+--------------------+------------+- | id | select_type | table | +----+--------------------+------------+- | 1 | PRIMARY | <derived3> | | 3 | DERIVED | T2 | | 2 | DEPENDENT SUBQUERY | T1 | +----+--------------------+------------+- EXPLAIN の実行計画はネステッドループの順番表みたいになっている • SELECT * のループ ◦ 派生テーブルを生成する T2 への SELECT ▪ T1 への SELECT（ T2 の値に依存）

UNCACHEABLE SUBQUERY mysql> EXPLAIN SELECT * ,(SELECT @a FROM T1
LIMIT 1) T FROM T2; +----+----------------------+-------+- | id | select_type | table | +----+----------------------+-------+- | 1 | PRIMARY | T2 | | 2 | UNCACHEABLE SUBQUERY | T1 | +----+----------------------+-------+- サブクエリがキャッシュされないケースとしてユーザー変数 @a が含まれている場合ユーザー変数使うなどがんばらないと Uncacheable にはならない、多くはキャッシュされるならネストされてたり行数多くても良いのでは？メモリでもコンパクトに、 L1,2,3キャッシュを意識しないと DB では遅い時代に

SIMPLE mysql> EXPLAIN SELECT * FROM T1 INNER JOIN T2
ON T1.id = T2.id; +----+-------------+-------+- | id | select_type | table | +----+-------------+-------+- | 1 | SIMPLE | T1 | | 1 | SIMPLE | T2 | +----+-------------+-------+- それぞれのテーブルへのアクセスはサブクエリなど含まないので SIMPLE JOIN は一つの id で実行されるので同じ id : 1

何故 EXPLAIN で ref という用語が頻出なのか？実行計画 = JOIN =
サブクエリの計画サブクエリの関心は外のデータをどう参照しているか? になるので reference ワード多用

結合タイプの話の前に、使っているテーブル定義 mysql> desc inventories; +---------+--------+------+-----+ | Field | Type |
Null | Key | +---------+--------+------+-----+ | id | bigint | NO | PRI | | user_id | bigint | YES | MUL | | item_id | bigint | YES | MUL | +---------+--------+------+-----+ +----+---------+---------+ | id | user_id | item_id | +----+---------+---------+ | 1 | 594 | 831 | +----+---------+---------+ mysql> desc users; +-------+-------------+- | Field | Type | +-------+-------------+- | id | bigint | | name | varchar(64) | +-------+-------------+- mysql> desc items; +-------------+-------------+- | Field | Type | +-------------+-------------+- | id | bigint | | name | varchar(64) | | description | text | +-------------+-------------+- foreign key 注）業務における最適なテーブル定義については所属チームの先輩方に確認しましょう！

index フルスキャンの例外として、 Extra に “Using Index” がついている場合はデータ的にインデックスの取得で足りていてプラ
イマリキー不要な「カバリングインデックス」で動作この場合重くないこともあるオプティマイザは行数が 4〜16倍程度で済むならインデックスの range 検索ではなくプライマリキーの ALL を選択しがち。実際その方が速いことも多い。 type 続き

ここ重要！加えて EXPLAIN のサブクエリ行毎に、ネストしたループの掛け算の行数でのアクセスになることも忘れなく！多段のループも静的な場合と、外の値に依存してて毎回クエリ実行されている場合とがあるので、さらに注
意！！

おまけ

何故 NLJ 採用か？を考えることで見えてくる物 • 殆どの JOIN は CROSS JOIN の特殊系としても実装出来る
• JOIN = サブクエリでもある • JOIN の自然な実装として NLJ で作っておけば SQL の仕事だいたいカバー 100 200 200 300 MySQL 5.7 で scores テーブル cross join の自己結合で <= の行を集計していくとランキングになる 100 200 200 300 SELECT s1.id, s1.score, COUNT(*) AS ranking FROM scores s1 CROSS JOIN scores s2 ON s1.score <= s2.score GROUP BY s1.id; （パフォーマンスが悪い例なので仕事では使わないように！仕事のクエリは所属チームの先輩に聞きましょうｗ） +----+-------+---------+ | id | score | ranking | +----+-------+---------+ | 1 | 100 | 4 | | 3 | 200 | 3 | | 2 | 200 | 3 | | 4 | 300 | 1 | +----+-------+---------+

MySQL EXPLAIN 解説

MySQL EXPLAIN 解説

Infiniteloop

More Decks by Infiniteloop

Featured

Transcript

MySQL EXPLAIN 解説 2023-08-25 新卒講義（株）インフィニットループ事業基盤マネージャー波多野信広

内容 • EXPLAIN で出力される実行計画の解説 • ota さん資料 https://www.infiniteloop.co.jp/tech-blog/2011/03/mysql-index-explain/ の EXPLAIN

EXPLAIN を読む上で、理解しやすくなるポイント MySQL は SQL を理解し実行する SQL のレイヤーとトランザクショナル Key Value

EXPLAIN を読む上で、理解しやすくなるポイント MySQL (InnoDB) のテーブル構造は、全てのインデックスがプライマリキーへの参照になっている「クラスター・インデックス」「索引編成表」 pkey ・・・ ix1 ・・・

EXPLAIN を読む上で、理解しやすくなるポイント JOIN には単純なネステッド・ループを使います INNER JOIN で２つの列の同値を探す場合、人間の感覚では２つ並べて交互に比較しますが・・・ 1 2 3

EXPLAIN を読む上で、理解しやすくなるポイント左の１行ごとに、右のテーブルを毎回スキャンして愚直に INNER JOIN を解決 1 2 3 4

EXPLAIN を読む上で、理解しやすくなるポイント SELECT文の評価順序 https://qiita.com/suzukito/items/edcd00e680186f2930a8 1. FROM 2. ON 3. JOIN

ota さん資料拝借

EXPLAIN の id, select_type, table 補足 • id : サブクエリ

UNION, UNION RESULT mysql> EXPLAIN SELECT * FROM T1 UNION

SUBQUERY mysql> EXPLAIN SELECT *, (SELECT id FROM T2 WHERE

DERIVED mysql> EXPLAIN SELECT * FROM (SELECT id FROM T1

DEPENDENT SUBQUERY mysql> EXPLAIN SELECT *, (SELECT id FROM T1

UNCACHEABLE SUBQUERY mysql> EXPLAIN SELECT * ,(SELECT @a FROM T1

SIMPLE mysql> EXPLAIN SELECT * FROM T1 INNER JOIN T2

何故 EXPLAIN で ref という用語が頻出なのか？実行計画 = JOIN =

結合タイプの話の前に、使っているテーブル定義 mysql> desc inventories; +---------+--------+------+-----+ | Field | Type |

type : const mysql> EXPLAIN SELECT * FROM inventories WHERE

type : eq_ref と ALL mysql> EXPLAIN SELECT U.name, I.name

type : ref と ALL mysql> EXPLAIN SELECT I.id, U.name

type : ref_or_null mysql> EXPLAIN SELECT * FROM inventories I1

index フルスキャンの例外として、 Extra に “Using Index” がついている場合はデータ的にインデックスの取得で足りていてプラ

おまけ

何故 NLJ 採用か？を考えることで見えてくる物 • 殆どの JOIN は CROSS JOIN の特殊系としても実装出来る

DB で何故 NLJ 採用か？を考えることで見えてくる物 • MySQL 出来たころ：HDD はシーケンシャルならまぁまぁ速く、メモリなら速い • 近年：大容量メモリに載っただけの