Slide 1

Slide 1 text

PHP で負荷試験のシナリオを書きたい!の で amphp を使って自作した件 2023/09/16 PHP カンファレンス沖縄 やまゆ

Slide 2

Slide 2 text

セッション概要 jMeter, Locust, k6, ... 負荷試験ツールは色々ありますが、どれも PHP でシナリオを書くことができません。 PHP のコードは PHP でシナリオ も書いてしまった方が一貫性があって良いですよね? PHP 8.1 から Fiber が入ったことで、 PHP でも非同期・並行的な処理が簡単に実装 出来るようになりました。 PHP によるシナリオツール、 ないなら作ろう精神 で、自作することにしました。 Fiber ままで並行処理を作るのは大変なので、今回は amphp を使って簡単に distributed なシステムを構築します。 今回は何故自作したのか、どのように並行処理を実装したのかを紹介します。 ターゲット 負荷試験したい方 PHP で並行処理ってどうやるの?という方

Slide 3

Slide 3 text

赤魔道士系エンジニア ㈱インフィニットループ at 札幌/仙台 
 やまゆ この画像は自撮りでも いつも使っているアイコンでも構いません ☕

Slide 4

Slide 4 text

負荷試験

Slide 5

Slide 5 text

負荷試験 大規模 Web サービスのリリース・大規模アプデに欠かせない事前テスト 想定された Monthly Active User(MAU) から仮定する Request per sec(rps) が安定 して稼働するか、負荷をかけ続けて試験すること ↓やらないとどうなる? - 事前スケーリングのサイズが決まらない - リリース時に🔥炎上🔥する

Slide 6

Slide 6 text

負荷試験内容 1. MAU 定義 2. シナリオ定義 3. rps 定義 4. 負荷シナリオプログラム作成 5. 実施・監視・適宜最適化 6. レポート

Slide 7

Slide 7 text

負荷試験定義例 - 事前のアンケートや類似事例から MAU を検討 - 想定されたシナリオをいくつか作成 - トップページ -> リンク回遊 -> ユーザー登録 -> プロフィール編集 -> リンク回遊 - トップページ -> ユーザー登録 -> 課金 -> リンク回遊 - ソシャゲ: ユーザー登録 -> ログイン -> チュートリアル -> コアサイクル - シナリオから「何秒おきにどんな API 順で呼ばれるか」表を作成 - 同時に、シナリオ表をプログラム化(機械的に呼べるようにする) - MAUとシナリオ表から「1秒間に何リクエスト送られるか」を推測

Slide 8

Slide 8 text

負荷試験定義例: rps - 仮に 20 万 MAU とする - 仮定として、全体の 50 %(10万) が最大の同時接続数とする - シナリオ表から、平均的な rps が 0.2 であるとする - 100,000 * 0.2 = 20,000 rps - このサービスに安定・継続して耐えるべき値は 20,000 rps と仮定

Slide 9

Slide 9 text

Next action? 20,000 rps を耐えられる構成を考える そもそも 20,000 rps がどのリソースにどれくらいの負荷を掛けるのか、計測する必要 がある ということで機械的に計測するための負荷試験ツールの出番!

Slide 10

Slide 10 text

負荷をかける (HTTP リクエストする) ツール

Slide 11

Slide 11 text

Apache jMeter https://jmeter.apache.org/

Slide 12

Slide 12 text

Locust https://locust.io/

Slide 13

Slide 13 text

Locust Scenario(Python)

Slide 14

Slide 14 text

k6 https://k6.io/

Slide 15

Slide 15 text

k6 Scenario(JavaScript like)

Slide 16

Slide 16 text

PHP なくない?

Slide 17

Slide 17 text

じゃあ作るか

Slide 18

Slide 18 text

heavyrain

Slide 19

Slide 19 text

heavyrain - PHP Loadtest/Stresstest tool

Slide 20

Slide 20 text

heavyrain - PHP Loadtest/Stresstest tool

Slide 21

Slide 21 text

Why? - Locust 使っていたが python かぁ...となる - k6 もなんか変な JavaScript だしなぁ...となる - jMeter…となる - PHP でシナリオ書けるのが一番楽やろ - 今は PHP でも Fiber 等で並行処理強くなってきたし - 自分が一番欲しい(普通にプロジェクトの負荷試験に使いたい) - ないなら作ろう精神

Slide 22

Slide 22 text

同期的だと無理

Slide 23

Slide 23 text

同期処理シーケンス

Slide 24

Slide 24 text

非同期処理シーケンス

Slide 25

Slide 25 text

非同期処理における並行 & 並列 非同期処理には種類がある - 並行(Concurrency) - 並列(Parallelism) 言語の仕組みによって並行性が高かったり並列性が高かったりする 言語だけでなくドキュメントでもこの表現は揺れているので、今回の資料では - 並行=シングルスレッドでうまいこと非同期する - 並列=マルチスレッド・マルチプロセスで非同期する とする。

Slide 26

Slide 26 text

PHP は(基本的に)シングルスレッド なので「並列」ではなく「並行」が近い マルチプロセスは可能だが、プロセス間通信はちょっと大変 マルチスレッドは extension を使えば可能(zts じゃないとダメ)

Slide 27

Slide 27 text

JavaScript も(基本的に)シングルスレッド

Slide 28

Slide 28 text

Fiber

Slide 29

Slide 29 text

Fiber https://www.php.net/manual/ja/language.fibers.php サードパーティ extension なしで「非同期・並行処理」を実現できる API PHP 8.1 から利用可能 シンプルで低レベルの API を提供している

Slide 30

Slide 30 text

No content

Slide 31

Slide 31 text

シンプルすぎて わからん 🤔

Slide 32

Slide 32 text

Revolt

Slide 33

Slide 33 text

Revolt イベントループを管理してくれる低レベル API ライブラリ - Defer: go の defer みたいに、イテレーションの最後に - Delay: x 秒後に - Repeat: x 秒おきに - Stream readable: ストリームが読み込めるようになったら - Stream writable: ストリームに書きこめるようになったら - Signal: プロセスシグナルを OS から受け取ったら

Slide 34

Slide 34 text

No content

Slide 35

Slide 35 text

シンプルすぎて わからん 🤔

Slide 36

Slide 36 text

amphp

Slide 37

Slide 37 text

amphp Revolt をベースとした高レベル非同期 API を提供するライブラリ群 File, Log, MySQL, Redis などの I/O 処理を非同期化し ブロックしない形で実行出来るライブラリがある HTTP Server を動かすこともできる

Slide 38

Slide 38 text

No content

Slide 39

Slide 39 text

async await

Slide 40

Slide 40 text

async? 「将来どこかで終わるけど、今はまだ終わってないと思う」という表明的なもの (既に終わっている時もある) 色んな言語で実装されているが、 PHP はライブラリレベルで実装 `function async(\Closure $callback): Future` Future だったり Promise だったりする(概念が違うが似た系統)

Slide 41

Slide 41 text

await? async なクロージャが完了するまで待つ `$results = await($futures)` 複数のクロージャが全て完了するまで待つことも出来る JavaScript の変遷をたどると分かりやすい SoftwareDesign 2023年9月号に詳しく載ってます! (他人の記事を勝手に宣伝) https://gihyo.jp/magazine/SD/archive/2023/202309

Slide 42

Slide 42 text

heavyrain

Slide 43

Slide 43 text

heavyrain での非同期処理 - ほとんどの処理は HTTP レスポンスが来るまでの待機時間 - 同期処理すると、 CPU が暇 - 暇している間に別のリクエストを実行したい - そこで「非同期」処理 - シングルスレッドで「同時に x リクエスト」出来るようにする!

Slide 44

Slide 44 text

目指せ「1,000 並行」 extension なしだと「1,024 ファイルディスクリプタ」が限界値 ディスクリプタ数が増えると線形に遅くなるので実際そこまではいかなさそう extension を入れるともっと増やせる(最大はエフェメラルポート数くらい?) 現状だと amphp/ext-uv が比較的アクティブにメンテされている node.js でも使われていた libuv を使った PHP 拡張

Slide 45

Slide 45 text

まずは「 HTTP シナリオ」を書けること リクエストとレスポンスの連なり(シナリオ)を表現できる必要がある POST /register -> POST /login -> GET /me -> POST /post -> … - HTTP リクエストを送る - 前のレスポンスのデータを使う - 途中暗号化や認証を行えるようにする(ミドルウェア) - 1人のユーザーの一連のシナリオをスクリプトに変換する

Slide 46

Slide 46 text

No content

Slide 47

Slide 47 text

ClientInterface - 簡単に HTTP リクエストを実行出来る API を定義 - PSR-7 互換 - Locust や k6 などを参考にした

Slide 48

Slide 48 text

AssertableResponseInterface - assertion も出来るし json body も取得出来る便利な Response API - これも PSR-7 互換

Slide 49

Slide 49 text

MiddlewareInterface - リクエスト間で共通の処理を行える API - これも PSR-7 互換 - 暗号化(ボディ改変)・認証(ヘッダ改変)などを行える

Slide 50

Slide 50 text

ExecutorInterface - 実際に「シナリオを無限に実行し続ける」 API - OS Signal などで途中でキャンセル出来る - ここで「非同期」を発動!

Slide 51

Slide 51 text

AmphpExecutor 非同期処理のコア部分の実装 ループでたくさん並行に 実行していく TODO は色々あるが ベースは大体これ

Slide 52

Slide 52 text

Heavyrain の未来 - 「シナリオテスター」として 1 並列でシナリオが一通り動く - Ramp-up(ちょっとずつ同接が増えていく) の仕組み - 数万 rps, 数十万 rps の負荷をかけれるようになる - 複数マシンを使った 分散負荷かけ環境 - OpenAPI 3.0 から ClientInterface 実装を自動生成 - HARReporter によるシナリオ可視化 - Locust のような Web GUI - Amphp の詳細は PHPCon 2023(東京) で話します!!

Slide 53

Slide 53 text

次は東京で で会いましょう!

Slide 54

Slide 54 text

北海道でも 会いましょう!

Slide 55

Slide 55 text

https://www.infiniteloop.co.jp