Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Grafana_LokiをECS_Fargateで構築する観点公開版.pdf
Search
Sponsored
·
Your Podcast. Everywhere. Effortlessly.
Share. Educate. Inspire. Entertain. You do you. We'll handle the rest.
→
clouddev-code
November 20, 2025
48
0
Share
Embed
Copy iframe code
Copy JS code
Copy link
Start on current slide
Grafana_LokiをECS_Fargateで構築する観点公開版.pdf
clouddev-code
November 20, 2025
More Decks by clouddev-code
See All by clouddev-code
Regional_NAT_Gatewayについて_basicとの違い_試した内容スケールアウト_インについて_IPv6_dual_networkでの使い分けなど.pdf
cloudevcode
1
910
ADK_for_Java.pdf
cloudevcode
1
100
initContainerをECSで実現したい.pdf
cloudevcode
0
37
VPC_Lattice検討したが_採用しなかった話.pptx.pptx.pdf
cloudevcode
0
31
Presentation_-_コンテナイメージ高速化技術.pptx.pdf
cloudevcode
0
39
GitHub_Copilot_AgentでするMCP_Streamable_HTTPまで.pdf
cloudevcode
0
120
EKS_Auto_Mode_Deep_Live.pdf
cloudevcode
0
59
re_invent_2024アップデートで実現可能なアーキテクチャを考える.pdf
cloudevcode
1
320
WebAssembly_workloadをEKSで利用するには.pdf
cloudevcode
0
1.6k
Featured
See All Featured
The Curious Case for Waylosing
cassininazir
1
390
Gemini Prompt Engineering: Practical Techniques for Tangible AI Outcomes
mfonobong
2
430
Lightning Talk: Beautiful Slides for Beginners
inesmontani
PRO
2
580
Efficient Content Optimization with Google Search Console & Apps Script
katarinadahlin
PRO
1
620
実際に使うSQLの書き方 徹底解説 / pgcon21j-tutorial
soudai
PRO
201
75k
Templates, Plugins, & Blocks: Oh My! Creating the theme that thinks of everything
marktimemedia
31
2.8k
Done Done
chrislema
186
16k
Raft: Consensus for Rubyists
vanstee
141
7.5k
Navigating the moral maze — ethical principles for Al-driven product design
skipperchong
2
390
"I'm Feeling Lucky" - Building Great Search Experiences for Today's Users (#IAC19)
danielanewman
230
23k
Making the Leap to Tech Lead
cromwellryan
135
9.9k
The SEO Collaboration Effect
kristinabergwall1
1
490
Transcript
Grafana LokiをECS Fargateで構築した話 2025.11.19 氏名 : 蛭田 聡司 CloudNative Days 2025
5分LT #CNDW2025
11月4回目のLT https://speakerdeck.com/cloudevcode
プロフィール Profile 01 Name Soushi Hiruta 02 Work 基盤設計構築 03
Community CommunityBuilder 2025 ( Container Category ) 04 興味 KubeConEU 2023~2026 05 Social X @web_se GitHub clouddev-code
目次 CONTENT 01 Grafana Lokiについて Lokiの構成 02 Grafana Lokiモニタリング Lokiモニタリングの観点について触れます
03 ECS Fargate で特性 ECS Fargateは基本ステートレスで利用する。AWS 都合でタスク入替が発生します 04 ECS FargateのLokiを構築する上での考慮点 ステートレス環境でより可用性を最大限高めて作る観点 05 まとめ ECS Fargate での構成 実際の構成
Grafana Loki Lokiの構成 01
Lokiコンポーネント Lokiコンポーネントについて
書き込みフロー Fluentbitなどのログエージェントから送信されてストレージまでに到達するフロー
読み込みフロー Grafanaからログ検索されてログが検索されるフロー
Grafana Monitoring クエリ処理時間、接続エラー率などモニタリングは必要 02
metrics エンドポイントでレイテンシ等モニタリング ADOTでAmazon manged for Prometheousに収集 クエリパフォーマンス、Ingesterの状態を可視化できる モニタリング 分量の多いテキストを入力する際に便利なページです。 https://github.com/grafana/loki/blob/main/pkg/ingester/metrics.go#L44
loki_request_duraton_seconds_count 接続エラー率 loki_ingester_streams_created_total 5分間のingesterストリーム平均作成 率 loki_request_duration_seconds_sum 1リクエストの平均処理時間 loki_request_duration_seconds_bucket loki_s3_request_duration_seconds_bucket loki_distributor_bytes_received_total
loki_ingester_memory_chunks Prometheus metrics モニタリングすべきメトリクス。クエリパフォーマンス、書き込みリソースを把握する必要がある https://grafana.com/docs/loki/latest/operations/meta-monitoring/
Grafana Lokiの構成 実際構築した構成 03
Grafana Loki構成 ECS Fargateで構築した構成 https://grafana.com/blog/2021/08/11/a-guide-to-deploying-grafana-loki-and-grafana-tempo-without-ku bernetes-on-aws-fargate/ laCで構築してい る
ECS Fargateの特性 テンポラリストレージ、AWS都合で落とされることはある 04
ECS Fargateの特性 ストレージは揮発性で、意図しない Task入替は発生する ストレージは揮発性 AWS都合でECS Task入替は発生する StatefulSetのようなステートフルなワークロードにはむかない
ECS FargateでLokiを運用した考慮点 ここにはタイトルを補足する内容を記入してください。 05
WAL Write Ahead Logを永続的なストレージに保存したい WALはドキュメント上にも、StatefulSet、永続ストレージで保持するとかかれ ている –ingester.flush-on-shutdown WALログ WAL Write
Ahead Log
複数タスクからWALログファイルが競合してしまった 競合してしまうと、ファイルも破損して、復旧もできなくる。 ドキュメント上でも破損してしまうといけないことは書かれている WALログをEFSでしようとしたが。。。 分量の多いテキストを入力する際に便利なページです。 https://grafana.com/docs/loki/latest/operations/storage/wal/
SIGKILL時でのノードのデータをS3にフラッシュ /ingester/shutdown?flush=true stop_timeout Fargateで最大に設定できる120s Task終了時にフラッシュする 突然死も0%ではない
低頻度だが突然死もある。この場合SIGKILL(Signal Kill)の後処理は行えな い。 突然死は頻度も少ないこともありあきらめる クラッシュリカバリ 突然死も0%ではない
• Task終了時にflashさせるようにする • ringから入替発生したECS Taskを抜く • クラッシュリカバリはあるがECS FargateでもLoki基盤は運用できる LokiをFargateでも運用できる まとめ
索引 • loki deployment modes ◦ https://grafana.com/docs/loki/latest/get-started/deployment-modes/ • Web Ahead
Log ◦ https://grafana.com/docs/loki/latest/operations/storage/wal/ • 最短で理解して運用するGrafana Loki ◦ https://zenn.dev/taisho6339/articles/0654040691aaab