Slide 1

Slide 1 text

EventLoop の実装から考えるFiber PHPerKaigi petit - PHP8.1 リリース祝賀会 2021-12-21 @hanhan1978

Slide 2

Slide 2 text

自己紹介

Slide 3

Slide 3 text

こんなのを PHP カンファレンス2021 でやった。 https://speakerdeck.com/hanhan1978/php-async-programming

Slide 4

Slide 4 text

ペチコンの内容を3行でまとめると... 非同期処理はわからん Fiber よくわからん とりあえず、PHP でPHP を動かせ 全体的に、分かってるやつしか分からん構成になってしまって反省し ている。

Slide 5

Slide 5 text

8.1 リリース祝賀会バージョンでは... Fiber 完全に理解している 非同期処理を完全に理解している わかりやすく説明できる自信がある

Slide 6

Slide 6 text

Fiber を理解する必要はあるか? よくある解説 これがイヤな場合 -> Fiber を理解しないといかん。 これでOK な場合 -> Fiber を実行基盤にもつフレームワークが登場した時に詰む -> つまり、Fiber を理解しないといかん。 なんとなく非同期処理ができるっぽいやつ。ライブラリ作成者の 為の機能、一般開発者は気にしなくて良い。 “ “

Slide 7

Slide 7 text

まじめな話 PHP ファンデーションとかもできたし、実装の詳細から逃げ回ってい るだけでは駄目。 みんなで知見をため、公表しあって、日本からもコミッターが出るよ うに盛り上げていかないとイカン。 今日一番まじめな話、終わり。

Slide 8

Slide 8 text

今日のゴール Fiber をみんなが完全に理解すること

Slide 9

Slide 9 text

物語の開始地点 なぜ、Fiber が求められているのか? なぜ、それがPHP に入ってくるのか? この物語のWHY が解決しないと、以降の議論は全て薄くなる。 非同期処理が2021 年現在、非同期処理から遠い位置にいるPHP にまで 言語機能として入ってこようとしているのはなぜ?

Slide 10

Slide 10 text

半導体の話 ムーアの法則が、頭打ちしつつある。電気的に、熱的に、集積度を上 げにくくなってる。 -> コアの性能アップは難しい -> だから、マルチコアで並行処理をすることで、スループットを上げ よう。 ここが開始地点。 パタヘネを読もう。

Slide 11

Slide 11 text

並行処理の話 これまでは、我々が気にする必要がなかった。 -> アプリケーションレイヤーの話ではなく、ハードウェアやOS の役 目 我々は同期処理パラダイスで生きていけた。

Slide 12

Slide 12 text

もったいない HTTP リクエストの応答待ち、DB クエリの応答待ち。この間、CPU は 遊んでる。 厳密には、遊んでるわけではないが、PHP のスクリプトは同期的処理 を行うため、きっちり応答をまつ。 結果として、CPU はその性能を全て引き出されていない状態になる。

Slide 13

Slide 13 text

もったいない

Slide 14

Slide 14 text

もったいなくない

Slide 15

Slide 15 text

もったいないサンプル dummy API ( リクエストにきっちり1 秒かかる)

Slide 16

Slide 16 text

古き良きPHP スクリプト (API を5 回叩く)

Slide 17

Slide 17 text

同期的HTTP リクエストの結果

Slide 18

Slide 18 text

なぜ、5 秒かかるのか? 1 + 1 + 1 + 1 + 1 = 5 だから。 PHP の組み込み関数はブロッキング。つまり、処理をブロックする HTTP Request -> 応答待ちで1 秒待つ 解消するためには、応答を待たずに次のLoop に入らないといけない。 HTTP Request -> 応答を待たずにLoop -> 結果が帰ってきたら出力

Slide 19

Slide 19 text

じゃあどうすればいい? file_get_contents は処理をブロックする... curl でも一緒... どうすれば、処理をブロックしないのか?誰がブロックするのか?

Slide 20

Slide 20 text

ブロックしていたのは誰? Socket ブロッキング、ノンブロッキングのモードを持つ。つまり、ノンブロ ッキングモードのSocket を使う file_get_contents を作ればいい。

Slide 21

Slide 21 text

ブロックしない file_get_contents

Slide 22

Slide 22 text

PHP によるブロックしないAPI コール

Slide 23

Slide 23 text

PHP によるブロックしないAPI コール結果 ブロックしない、非同期プログミングが完了。

Slide 24

Slide 24 text

NonBlocking 化による実行スレッドの流れ 夢は達成された。Generator も Fiber もいらなかったんや...

Slide 25

Slide 25 text

本当か? それを確かめるために、調査隊はさきほどのソースコードを Generator を使って書き直してみた。

Slide 26

Slide 26 text

非同期関数のGenerator 版

Slide 27

Slide 27 text

PHP によるブロックしないAPI コール(Generator 版)

Slide 28

Slide 28 text

通信結果を受け取る関数(Generator 版) ※まじで酷いコードだが、検証用なので許して。

Slide 29

Slide 29 text

Generator 版の実行結果 きっちり1 秒で5 リクエスト

Slide 30

Slide 30 text

Generator にしたことで何が起きた? 結果を受け取る処理が、g->current() に置き換わった。 Generator で停止したスレッドの再開 という形で抽象化された。

Slide 31

Slide 31 text

Generator 前のコード Socket から結果を受け取るという具象コードを書いている。 Generator を使うと 停止・再開 という文脈を活かした抽象化が出来 る。

Slide 32

Slide 32 text

Generator 化による実行スレッドの流れ 夢は達成された。 Fiber はいらなかったんや...

Slide 33

Slide 33 text

本当か? それを確かめるために、調査隊はさきほどのソースコードをFiber を使 って書き直してみた。

Slide 34

Slide 34 text

PHP によるブロックしないAPI コール(Fiber 版)

Slide 35

Slide 35 text

通信結果を受け取る関数(Fiber 版) ※Generator を返す必要が無くなった

Slide 36

Slide 36 text

通信結果を受け取る関数2(Fiber 版)

Slide 37

Slide 37 text

Fiber 版の実行結果 きっちり1 秒で5 リクエスト

Slide 38

Slide 38 text

Fiber にしたことで何が起きた? 停止スレッドは Fiber オブジェクトに抽象化 Fiber オブジェクトの処理内部では、どこからでも自分を停止でき る。 Generator と違って、 yield して主スレッドに戻す必要がない。

Slide 39

Slide 39 text

Fiber 化による実行スレッドの流れ ここまでのまとめ

Slide 40

Slide 40 text

個人的にポイントになると思うところ 非同期プログミングにおいては、主スレッドと分岐スレッドという考 え方を常に持つ必要がある。 今回の例だと、HTTP リクエストを投げているのは分岐スレッド 分岐スレッドがレスポンスが受け取ったことを検査して、分岐スレッ ドの停止・再開を行うのは主スレッド 非同期プログミングは、分岐スレッドを管理する主スレッドが必要

Slide 41

Slide 41 text

EventLoop とは? Swoole, ReactPHP, AmPHP などは、それぞれ EventLoop を実装し ている。 なぜ、彼らは EventLoop を実装する? EventLoop とは?? 並行処理をするのに、何故 EventLoop が必要なのか?

Slide 42

Slide 42 text

EventLoop 語弊を恐れずにいうと、ただのLoop さっきのサンプルのFiber 版では、Fiber オブジェクトを生成してLoop で回して処理をしていた。 これも広義のEventLoop といえる(はず)

Slide 43

Slide 43 text

EventLoop の構成要素 EventProvider 処理を Queue に追加 EventLoop スケジューラーに従って Event を 処理 EventHandler Event を実行する

Slide 44

Slide 44 text

EventLoop の構成要素 EventLoop はシングルスレッドでいい リクエストは Queue で一直線にされる (DeMultiplex) Reactor Pattern という

Slide 45

Slide 45 text

EventLoop と Fiber の関係 Fiber により、停止・再開が抽象化されると、処理が抽象的に、簡潔 にかけるようになる。 これが、Fiber の本当の意味。

Slide 46

Slide 46 text

Fiber の中身 ucontext というライブラリが使われている。このシステムコールは、 ユーザーコンテキストの作成・切替をサポートする。boost_context というやつもある。 Swoole は、boost_context を使って、Fiber っぽいことをやってい る。

Slide 47

Slide 47 text

この先の展開 Fiber で実装された EventLoop を持つフレームワークが出てくる。 (間違いない) Fiber が拡張され、スケジューラーやPromise, Async/Await が PHP に 提供される (8.3? 9.0?)

Slide 48

Slide 48 text

hanhan1978 の予定 Fiber で EventLoop を実装し、分かりやすいサンプルを書く。 EventLoop の構成要素を、分かりやすいサンプルで書く。 分かりやすい図で、下の概念を説明する。 スケジューラー non-preemptive 非同期、並行、このあたりはOS 周りの実装で出てくる。 OS 実装の本とかに参考になる記述が散見される。

Slide 49

Slide 49 text

PHPerkaigi にプロポーザル投げるの で、みんな星つけてね!