Webアプリケーションが今こそ知るべき、 RDBMSのパフォーマンスチューニングの勘所 / Basic-of-RDB

Webアプリケーションが今こそ知るべき、 RDBMSのパフォーマンスチューニングの勘所～未踏の速度を目指して～ Laravel JP Conference 2019

What is it? Laravelで開発速度は超速！！ではアプリケーションの実行速度は？

現場でよく見る話 • キャッシュが効かないところが重い • 夜間の集計batchが終わらない • 特定のページがめちゃめちゃ重い • ユーザが増えて、急に重くなった …etc

What is it? 開発速度と実行速度どちらも同じくらい大切

What is it? パフォーマンスの問題の原因が RDBMSのこと多くないですか？

What is it? 今日はRDBMSに敢えてフォーカスして話します

Webサービスを見るクライアントインターネットサーバサイド通信は常に往来してる DNS BGP ISP サーバネットワーク
アプリケーションここが今日の対象

RDBMS 一般的なWebアプリケーションアプリケーションブラウザ Laravel

Laravel RDBMS 一般的なWebアプリケーションアプリケーションブラウザここが今日の対象

あじぇんだ 1 自己紹介 2 RDBMSの基本的な仕組み 3 INDEXとJOIN 4 フレームワーク依存症 5
まとめ

自己紹介曽根壮大（34歳) 株式会社オミカレ副社長/CTO • 日本PostgreSQLユーザ会勉強会分科会座長 •
3人の子供がいます • 技術的にはWeb/LL言語/RDBが好きですそねたけとも

婚活といえばオミカレ https://party-calendar.net/

本を書きました https://www.amazon.co.jp/exec/obidos/ASIN/4297104083/maple036-22/

まとめ

RDBMSの基本的な仕組みまずはRDBMSを知る

RDBMSの基本的な仕組み SQLを実行するとき

• パーサ • リライタ • プランナ • オプティマイザエグゼキュータデータ
クライアント ① SQLを実行する ②SQLの構文を解析構文木の作成を行う ③最適な実行計画を生成 INDEXの利用の有無、 JOINのアルゴリズムなどを決める ④実行計画に沿ってクエリを実行し、データを取得 ⑤取得した結果をクライアントに返す

RDBMSの基本的な仕組み大体遅いのはエグゼキュータ

RDBMSの基本的な仕組み大体遅いのはエグゼキュータ ↓ エグゼキュータの振る舞いは実行計画で決まる

RDBMSの基本的な仕組み https://speakerdeck.com/soudai/shi-xing-ji-hua-falsehua 今日はEXPLAINの話はしませんこの資料でまとめてます

RDBMSの基本的な仕組みエグゼキュータが遅いとき

RDBMSの基本的な仕組みエグゼキュータが遅いとき ↓ RDBMSが苦手な実行計画になっている

RDBMSの基本的な仕組み RDBMSが苦手なこと ↓ リレーショナルモデルじゃないとき

RDBMSの基本的な仕組み

RDBMSの基本的な仕組み苦手じゃないけど遅いとき ↓ 正しくRDBMSを活用出来てない

RDBMSを活用出来てない例 • INDEXを利用できていない • 不要で大きなデータを取得してる • 複数回クエリを実行している（N+1問題） • テーブル設計が悪い …etc

次の章で話をします

不要で大きなデータの取得例記事id タイトル記事 1 Laravelカンファレンス登壇とても多い記事の詳細 2 失敗から学ぶRDBの正しい歩き方だだぢぢづづででどどーん！！
︙ ︙ ︙

不要で大きなデータの取得例記事一覧 1. Laravelカンファレンス登壇 2. 失敗から学ぶRDBの正しい歩き ︙ 1 2 3
4 5 … 次へデータ SELECT * FROM 記事 ORDER BY id LIMIT 10 OFFSET 1; ブログid タイトル記事クエリの結果イメージ記事データを使っていないのに取得している

不要で大きなデータの取得例記事一覧 1. Laravelカンファレンス登壇 2. 失敗から学ぶRDBの正しい歩き ︙ 1 2 3
4 5 … 次へデータ SELECT ブログid,タイトル FROM 記事 ORDER BY id LIMIT 10 OFFSET 1; ブログid タイトルクエリの結果イメージ不要なデータを削除して小さく

RDBMSの基本的な仕組み SQLアンチパターンのインプリシットカラムの1例

RDBMSの基本的な仕組みクエリで扱うデータを小さくする

取得するデータを小さくする • WHERE句で小さくする • FROM句で小さくする • 不要なJOIN句を無くす …etc

N+1問題 foreach ($blogs as $id => $blog) { echo $blog->get();
} もしget()の度にSQLが発行されたら？

RDBMSの基本的な仕組み ORMやクエリビルダが実行するクエリを知ることが大事

RDBMSの基本的な仕組みデータ設計は積み木

RDBMSの基本的な仕組みデータベース設計は積み木

RDBMSの基本的な仕組みしっかりと練られた初期設計検討された仕様追加 1 検討された仕様追加 2 正しく積み上げて行ける

RDBMSの基本的な仕組み初期設計

RDBMSの基本的な仕組み初期設計マジカルな初期設計をすると仕様変更が出来ない

RDBMSの基本的な仕組み初期設計仕様追加

RDBMSの基本的な仕組み初期設計仕様追加次の仕様追加はどうにも出来ないデータを取り出したり、保存することもままならない

RDBMSの基本的な仕組み RDBMSに適した設計が必要

RDBMSの基本的な仕組み

RDBMSの基本的な仕組み RDBMSに適した設計が必要 ↓ 苦手なことはNoSQLを検討する

まとめ

INDEXとJOIN B+Tree INDEX

B+Tree INDEXの仕組み WHERE user_id = 4000 ~5000 ～10000 ~2500 ~5000
~7500 ~10000 索引ブロックヘッダ user_id = 2501 (ブロックID,行ID)=(100,1) user_id = 2502 (ブロックID,行ID)=(100,2) user_id = 4000 (ブロックID,行ID)=(200,10) ： user_id = 4001 (ブロックID,行ID)=(201,1) user_id = 5000 (ブロックID,行ID)=(300,5) ： 201番ブロック 199番ブロック 200番ブロック表データ 10 9

200番 199番 201番 10 テーブルスキャン 1回で全行を取得 300ブロックの表なら、当然300ブロック取得＝シーケンシャルI/O 1番 300番
9 … …

INDEXを利用した場合表の1ブロックを利用するために最低4ブロック（①～④）取得＝ランダムI/O ~5000 200番ブロック 199番ブロック 201番
ブロック 10 9 ① ② ③ ④

INDEXとJOIN INDEXを利用できると 200 → 4 で50倍の効果

設定したINDEXが効かない • 検索結果が多い、全体の件数が少ない • 条件にその列を使っていない • カーディナリティの低い列に対する検索 • あいまいな検索 •
統計情報と実際のテーブルで乖離がある場合 …etc

INDEXの仕組み https://sql-performance-explained.jp/

JOINの種類と仕組み JOINは集合の組み合わせ

都道府県会員 FULL OUTER JOIN 都道府県会員 LEFT OUTER JOIN
都道府県会員 RIGHT OUTER JOIN 都道府県会員 INNER JOIN

JOINの種類と仕組み JOINのアルゴリズム

Nested Loop Join https://twitter.com/ikkitang/status/1092046172200390656

Hash Join https://twitter.com/ikkitang/status/1092046332825456640

Merge Join https://twitter.com/ikkitang/status/1092046475092054019

INDEXとJOIN みんなが大体使うのはNLJ なぜならMySQLはこれしかないから

Nested Loop Joinの特性 • 内部表の結合キーの列に利用できるINDEXがある場合、ループ数を省略できるため外部表が小さいほど高速になる • 内部表の結合キーが一意の場合は内部表対象レコードを絞りこめるため、より高速になる •
1レコードずつ確定するので、確定したレコードはレスポンスとして返すことができる

INDEXとJOIN Nested Loop Joinは掛け算

INDEXとJOIN Nested Loop Joinは掛け算 ↓ 1,000行と1,000行のJOIN=1,000,000行

INDEXとJOIN 適切なINDEXがある場合 1,000行 +（1,000×1）行となり 2,000行相当

INDEXとJOIN JOINはハイコストな処理だが INDEXと合わせて有効に使えば高速になる

まとめ

フレームワーク依存症基本的なSQLの話をしてきました

フレームワーク依存症ここまでの話をフレームワークを使ってるときに意識してますか？

RDBMS Model フレームワーク View 情報をやり取りする Modelが事実を加工し、情報に変更する事実をやり取りする SQLでやり取りするプログラミング言語
でやり取りする ORM リレーショナルモデルをプログラミング言語が扱うオブジェクトモデルに変換するまたはその逆を行う

フレームワーク依存症 ORMは漏れのある抽象化

http://soudai1025.blogspot.com/2016/11/rdbantipattern1.html

フレームワーク依存症フレームワークは強い制約と規約によって高い生産性を与えてくれる

フレームワーク依存症 SQLアンチパターンに出てくるフレームワーク依存の話

フレームワーク依存症 • マジックビーンズ • ポリモーフィック関連 • IDリクワイアド • キーレスエントリー

フレームワーク依存症これらの話は今日はしません

フレームワーク依存症 ORMもフレームワークも絶対悪では無い

フレームワーク依存症 ORMもフレームワークも絶対悪では無い ↓ 漏れのある抽象化と付き合うよりよい抽象化を目指す

フレームワーク依存症例えばRepositoryパターン

RDBMS View 会員ページ会員テーブル会員サービス会員データ Model ORM SQL 会員リポジトリ
サービスに必要なビジネスロジックキャッシュストレージフレームワークデータクラスはサービスが必要な会員のデータを取り出し、加工する。場合によってはキャッシュから取り出したり、 RDBMSから取り出したりするリポジトリクラスはデータのCRUD部分だけを担う。 ORM経由でもSQLでもサービスクラスからは関係ない

フレームワーク依存症フレームワークに依存しない最適な設計を常に模索する

まとめ

まとめ Laravelは素晴らしいフレームワーク

まとめイチローのバットを使ってもイチローにはなれない

まとめ抽象化されている箇所については忘れないこと

まとめときにはRDBMSだったりときにはHTTPプロトコルだったり

まとめ仕組みには先人の知恵があり抽象化には理由がある

まとめ仕組み（フレームワーク）を活用するには先人の歴史を知ることも大切

まとめ使い方だけに囚われずに本質を知りより良いソフトウェアを生み出しましょう

ご清聴ありがとうございました

Webアプリケーションが今こそ知るべき、 RDBMSのパフォーマンスチューニングの勘所 / B...

Webアプリケーションが今こそ知るべき、 RDBMSのパフォーマンスチューニングの勘所 / Basic-of-RDB

More Decks by soudai sone

Other Decks in Technology

Featured

Transcript