Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Envoy.なんか / Kyoto.なんか #5
Search
cohalz
August 24, 2019
Programming
1
200
Envoy.なんか / Kyoto.なんか #5
Kyoto.なんか #5
https://kyoto-nanka.connpass.com/event/141982/
の発表資料です
cohalz
August 24, 2019
Tweet
Share
More Decks by cohalz
See All by cohalz
はてなにおけるfujiwara-wareの活用やecspressoのCI/CD構成 / Fujiwara Tech Conference 2025
cohalz
3
4.8k
はてなのSRE組織2024 / Road to SRE NEXT@福岡
cohalz
2
1.7k
SREのキャリア、 あるいは生態 / #ya8
cohalz
11
1.6k
カンファレンスのボランティアスタッフって何やるの? / DAIMYO Meetup #4
cohalz
0
140
小さなものでも Step Functions / Serverless Meetup Fukuoka Re:boot
cohalz
0
180
ECSのCI/CD改善と標準化の取り組み / JAWS FESTA 2023 in Kyushu
cohalz
8
6.9k
ecspressoへの貢献を振り返る / JAWS-UG コンテナ支部 #24 ecspresso MeetUp
cohalz
1
6.7k
はてなフォトライフをECSに移行した話 / Hatena Engineer Seminar #20
cohalz
1
19k
SREの異動と働き方 〜はてなブログ編〜 / Hatena Engineer Seminar #13
cohalz
0
2.3k
Other Decks in Programming
See All in Programming
お前もAI鬼にならないか?👹Bolt & Cursor & Supabase & Vercelで人間をやめるぞ、ジョジョー!👺
taishiyade
6
4k
AWS Organizations で実現する、 マルチ AWS アカウントのルートユーザー管理からの脱却
atpons
0
150
時計仕掛けのCompose
mkeeda
1
290
Amazon ECS とマイクロサービスから考えるシステム構成
hiyanger
2
550
Honoとフロントエンドの 型安全性について
yodaka
7
960
DevinとCursorから学ぶAIエージェントメモリーの設計とMoatの考え方
itarutomy
1
680
2,500万ユーザーを支えるSREチームの6年間のスクラムのカイゼン
honmarkhunt
6
5.3k
Introduction to kotlinx.rpc
arawn
0
690
Grafana Loki によるサーバログのコスト削減
mot_techtalk
1
130
Spring gRPC について / About Spring gRPC
mackey0225
0
220
ソフトウェアエンジニアの成長
masuda220
PRO
10
1.1k
SRE、開発、QAが協業して挑んだリリースプロセス改革@SRE Kaigi 2025
nealle
3
4.3k
Featured
See All Featured
Large-scale JavaScript Application Architecture
addyosmani
511
110k
Save Time (by Creating Custom Rails Generators)
garrettdimon
PRO
29
1k
[RailsConf 2023 Opening Keynote] The Magic of Rails
eileencodes
28
9.3k
Music & Morning Musume
bryan
46
6.3k
Designing Dashboards & Data Visualisations in Web Apps
destraynor
231
53k
Mobile First: as difficult as doing things right
swwweet
223
9.3k
The MySQL Ecosystem @ GitHub 2015
samlambert
250
12k
Navigating Team Friction
lara
183
15k
We Have a Design System, Now What?
morganepeng
51
7.4k
Side Projects
sachag
452
42k
Visualization
eitanlees
146
15k
Building Better People: How to give real-time feedback that sticks.
wjessup
367
19k
Transcript
Envoy.なんか Kyoto.なんか #5 id:cohalz
None
自己紹介 ・id:cohalz / @cohalz ・はてなインターン 2017 ・はてな SRE (~ 2018)
・最近異動してブログチームへ ・主戦場: AWS
Q. Envoyって知ってますか?
A. HAProxyみたいな便利なやつです
Envoy ・L4/L7プロキシ ・一通りのプロキシ・ロードバランサ機能 ・Circuit Breaker / Fault Injection ・API経由による設定更新 ・ログ・メトリック・トレーシング連携
Envoy 用語集 ・Cluster ・接続先をまとめた単位、Circuit Breakerはここに書く ・ Listener ・待受けポートとかアクセスログとかFault Injectionはここに書く ・Router
・ルーティング情報とかリトライ・タイムアウトはここに書く
Circuit Breaker ・閾値よりも多くなったら接続せず即エラーを返す機能 ・requestやpending, retryの数で設定できる ・目的としては、 ・レイテンシの悪化(カスケード障害)を防ぐ ・接続先の負荷軽減
Circuit Breaker ・遮断時は超過した分だけエラーを返す ・つまりは最大値の設定 ・遮断したらすべてがエラーになるわけではない
Fault Injection ・障害時の挙動を再現できる機能 ・レスポンスを遅延 ・503など特定のステータスコードを返す ・確率やヘッダベースで条件を決める
Fault Injection ・思ってた以上に便利 ・書いたエラー処理が適切にハンドリングできてるかわかる ・ヘッダベースで注入は色々可能性がありそう
メトリック ・統計情報を出すエンドポイントが用意されている ・レスポンス時間等のヒストグラム ・Circuit BreakerやFault Injection ・種類が多すぎて困るレベルにある
Mackerelプラグイン ・社内でプロトタイプ作成中、そのうち公開されるかも
API経由での更新 ・Envoyサーバに設定を持たずAPI経由で情報を取得できる ・xDS APIと呼ばれREST・gRPCで更新できる ・エンドポイントやルーティングといった単位
API経由での更新方法 ・適切なレスポンスを返せるAPIサーバの実装が必要 ・公式のライブラリはあるが手間
サーバを立てずに外部から更新したい ・設定ファイル入れ替えるためにコンテナ入れ替えは重い ・Fargateとか使ってるとなおさら時間かかる ・コンテナ入れ替えず外部から更新できないか?
サーバを立てずに外部から更新したい ・ローカルファイル経由で読み込む方法を使う ・実は指定したファイルの更新を検知して自動リロードする https://medium.com/grensesnittet/file-based-dynamic-configuration-of-routes-in-envoy-proxy-6234dae968d2
S3に置いたファイルをマスターにできないか ・ファイル置き場といったらS3 ・毎分s3 syncするだけのDockerイメージを作っていた
S3に置いたファイルをマスターに ・これをサイドカーにしてEnvoyとボリュームを共有 ・毎分S3 から設定をpollingできるEnvoyサーバの完成!! ・Pros: コンテナ入れ替えなくとも簡単に更新できる ・Cons: 更新まで最大一分の遅延がある
Envoyのハマりどころ
X-Rayと一緒に使うとき ・X-Rayのサービスマップはホストヘッダを見ている ・Envoyのエンドポイントでまとめられてしまう
X-Rayと一緒に使うとき ・AppにEnvoy用に接続先書き換えるロジックを入れて解決 ・EnvoyのX-Ray連携早く入って欲しい
設定のバリデーション ・ファイル分割してるとバリデーション難しい ・ミスっても設定更新されないだけで落ちない ・これをCIで検知 ・ログレベルいじって数秒だけ起動させファイルに書く ・そのファイルが作られてたらアウトに ・一応バリデーションツールはあるが動かせてない
timeout周り ・いろんなtimeoutがあって混乱する ・connect_timeout (Cluster) ・timeout (Router) ・per_try_timeout (Router) ・request_timeout (Listener)
・レスポンスを見てるのはtimeoutとper_try_timeout
Fault Injection・timeout ・遅延注入しつつ timeout を調整するの難しい ・response timeout は遅延とは独立 ・ログや統計から適切な timeout
を設定したほうがいい
Retry・Circuit Breaker ・timeout を短め・retry を多め ・何回も接続しようとしてDoSになってしまう ・Circuit Breakerの閾値が低め ・リソース余ってるのにエラーになる ・でも閾値緩めると設定が意味なくなる
・いい感じにやっていくしかない
その他 ・MySQLプロキシやHTTP_PROXY相当の機能もある ・まだ安定版ではないので注意 ・公式ブログからのドキュメントがリンク切れしててだるい ・あとApp Meshは機能がなさすぎる
HAProxy 2.0 ・Envoyにある機能どんどん取り込んでいて気になっている https://www.haproxy.com/blog/haproxy-2-0-and-beyond/
感想 ・マイクロサービスやっていくために便利に使える ・アプリから通信周りの知識を剥がせるだけでも便利 ・メトリック可視化しないと設定むずすぎる!! ・導入知見が全然流れてこなくて困る