protoactor-goで Pregelを作った話

protoactor-goで Pregelを作った話 rerorero mercari.go #9 2019/7/17

グラフプロセッシング

大規模グラフの計算 - 高級なマシンを使うか、MapReduceが主流 - MapReduceはステートレス。グラフプロセッシングでは計算のステップごとの結果を次のステップに渡す必要があり、これが膨大になるためI/Oが多く発生し効率が悪い

Pregel - Googleが内製した、大規模な有向グラフに対してアルゴリズムを実行するためのスケーラブルなフレームワーク - 2010年に同名の論文を発表 - コモディティハードウェアで大規模グラフの計算が効率的に行えるようになった

Pregelの仕組み - グラフのノード間でメッセージを送信しあう - ノードはアクティブ・非アクティブの状態を持つ - メッセージを受け取らないなど、特定の条件でノードは非アクティブになる - すべてのノードが非アクティブになったら計算終了 -
特定の計算アルゴリズムに依存しない - Pregelに向かないアルゴリズムもある

3 6 1 2 例：最大値値アクティブノード値非アクティブノード
値値が更新されたノードメッセージ

3 6 1 2 例：最大値 3 6 6 2
2 1 値アクティブノード値非アクティブノード値値が更新されたノードメッセージ

6 6 6 2 例：最大値 3 6 6 2
2 1 値アクティブノード値非アクティブノード値値が更新されたノードメッセージ

6 6 6 2 例：最大値 3 6 6 2
2 1 値アクティブノード値非アクティブノード値値が更新されたノードメッセージ自分より大きい値を受け取ったらその値で更新値を更新しなかったら非アクティブ

6 6 6 2 例：最大値 6 6 値アクティブノード
値非アクティブノード値値が更新されたノードメッセージ

6 6 6 6 例：最大値 6 6 値アクティブノード
値非アクティブノード値値が更新されたノードメッセージ

6 6 6 6 例：最大値 6 値アクティブノード値
非アクティブノード値値が更新されたノードメッセージ

Pregelの仕組み - 1つのマスターと複数のワーカーでクラスタを構成する - 複数ノードをパーティションと言う単位でまとめて扱う - パーティションの分割ルールに決まりはない - パーティションは任意の1つのワーカーに配置される

Pregel構成例ノードノードノードノードノードパーティションパーティションワーカーノード
ノードパーティションワーカーマスター Graph Database

どうやって作る？ - 分散システム - ノードの計算結果をメモリに持つ＆局所性が必要 - ワーカー、パーティション、ノードという複数のステートマシンが存在し、木構造を構成して通信しあう

アクターモデル

アクターモデル - 並行計算モデル - 競合を回避したい - メッセージパッシング

アクターモデル

アクターモデル Goにはchannelがあるのにこれ必要？

アクターモデル vs channel アクターモデル (protoactor-go) channel (CSP) 宛先を明示的に指定する宛先を指定しない送信時ブロッキングしない
（メッセージボックスがあふれる可能性）ブロッキングする（デッドロックする可能性）アクターツリー（親子関係）を構築できるツリー構築は提供していない goroutineの同期ポイントリモートプロセスとも通信できるシングルプロセス内で利用耐障害性親アクターが子アクターのリカバリーをする自動復旧はしないライブラリによって提供 Go言語によって提供

アクターモデルを使いたいケース - リモート = 分散システム - ステートフル = 状態の競合を避けたい、局所化したい -
耐障害性

アクターモデルが使えそうなケース - チャットサーバーやゲームサーバー - ユーザーアクティビティを一箇所で管理する - TIS社ではペイメントサービスで利用 - イベントソーシングと組み合わせ、ユーザーの残高更新を一箇所で行うことで整合性を保つ
- 「Using Akka Cluster for a payment service」 - https://speakerdeck.com/negokaz/using-akka-cluster-for-a-payment-service?slide=33

protoactor-go - アクターモデルを実装したGoのライブラリ - https://github.com/AsynkronIT/protoactor-go - Asynktronという会社がホストしている - プロダクションでも使っているらしい

Hello world （アクター側） import "github.com/AsynkronIT/protoactor-go/actor" type Hello struct{ Who string
} type HelloActor struct{} func (state *HelloActor) Receive(actorContext actor.Context) { switch msg := actorContext.Message().(type) { case Hello: fmt.Printf("Hello %v\n", msg.Who) } }

Hello world （メッセージ送信） import "github.com/AsynkronIT/protoactor-go/actor" func main() { props :=
actor.PropsFromProducer(func() actor.Actor { return &HelloActor{} }) pid, err := actor.EmptyRootContext.Spawn(props) if err != nil { // エラー処理 } actor.EmptyRootContext.Send(pid, Hello{Who: "Roger"}) }

耐障害性 - Let it crash - ハンドリングできないエラーが起きたらとにかくクラッシュ - 親のアクターが子のクラッシュを検知してリカバリーを試みる -
クラッシュさせるには panicを使う - Supervisor Strategy - 子アクターがクラッシュした時にどうリカバリーするかをカスタマイズできる

Supervisor Strategy decider := func(reason interface{}) actor.Directive { // リカバリーの方法にリスタートを選択
return actor.RestartDirective } // 1000msec間隔で最大10回までリカバリーを試みる supervisor := actor.NewOneForOneStrategy(10, 1000, decider) props := actor. FromProducer(func() actor.Actor { return &HelloActor{} }). WithSupervisor(supervisor) pid, err := actor.EmptyRootContext.Spawn(props) if err != nil { // エラー処理 }

Supervisor Strategy - One-For-One Strategy - クラッシュしたアクターのみリカバリーを試みる - All-For-One Strategy
- すべての兄弟アクターに対しリカバリーを試みる - Exponential Backoff Strategy - One-For-Oneのリトライ間隔がExponentialに増える

protoactor-go その他の機能 - .NETでも使える - リモートはgRPCで通信していて .NET ↔ Go でもクラスタを構築可能
- 他にもPython, Kotlin, JavaScriptのリポジトリも存在（動くかは不明・・） - plugin - メッセージをフックする処理を定義し、差し込むことができる - router - メッセージの送信先を複数アクターから 1つ選択する際の選択条件を指定できる - Virtual Actor - アクターモデルをさらに抽象化して Location TransparencyやAutomatic Scaleなどを提供する - MicrosoftのOrelansという論文がベース - Consulクラスタも別途必要になる

作ったもの Prerogel https://github.com/rerorero/prerogel - 最大値(maximum)と単一視点最短経路(sssp)のサンプルコード - たくさんマシンを借りて動かしてみたい（まだやってない） - k8sでスケールしたい -
※Spark on k8s があるらしいので、まともなやつが欲しい人は試してみるといいかもしれません - protoactor-goのおかげで1ヶ月くらいでそこそこ動くものができた

使ってみた感想 - アクターモデルは要件に合っていれば便利 - Goでアクターを使いたい場合はprotoactor-go一択（個人の見解です） - アクターモデルありきなら、成熟度という意味ではGo以外の選択肢も考えてもよさそう（Erlang, Akka）

ご清聴ありがとうございました参考文献 - A universal modular ACTOR formalism for artificial
intelligence: https://dl.acm.org/citation.cfm?id=1624804 - Microsoft Orleans: https://dotnet.github.io/orleans/ - Pregel A system for Large-Scale Graph Processing: https://www.cs.cmu.edu/~pavlo/courses/fall2013/static/papers/p135-malewicz.pdf - Apache Giraph: https://giraph.apache.org/ - A Bridging Model for Parallel Computation: http://web.mit.edu/6.976/www/handout/valiant2.pdf

protoactor-goで Pregelを作った話

protoactor-goで Pregelを作った話

rerorero

Other Decks in Programming

Featured

Transcript