Slide 1

Slide 1 text

AWS re:Invent 2025で見た Grafana最新機能のご紹介 1 濱田孝治(ハマコー)

Slide 2

Slide 2 text

2 濱田孝治(ハマコー) 製造ビジネステクノロジー部 マネージャー • 独立系SIerを経て2017年9月 クラスメソッド入社 ブログ, SNS • 「クラスメソッド 濱田」で検索 • はてなブックマーク累計 約15,000個 • Xアカウント:@hamako9999 コミュニティ運営 • JAWS-UG コンテナ支部運営 • Grafana Meetup Co-organizer, Grafana Champion! AWS認定関連 • 取得済みAWS認定:SAP, DOP, DBS, SOA, SAA, DVA, SCS, CLF, AIF, MLA, MLS • AWS APN Ambassador 2020, Top Engineer 2025, Community Builder 2025 執筆書籍 • みんなのAWS • SoftwareDesign 2022年11月号 コンテナ特集

Slide 3

Slide 3 text

3 re:Invent 2025の様子

Slide 4

Slide 4 text

4 私のAWS re:Invent 参加履歴 7回 2017, 2018, 2019, 2022, 2023, 2024, 2025

Slide 5

Slide 5 text

5 GrafanaのExpoブースは2024年から 7回 2017, 2018, 2019, 2022, 2023, 2024, 2025

Slide 6

Slide 6 text

6 Agenda • re:Invent 2025で聞いた Adaptive Telemetry • Grafana Assistant • Grafana CloudとGrafana OSS版の違い

Slide 7

Slide 7 text

7 re:Invent 2025で聞いた Adaptive Telemetry

Slide 8

Slide 8 text

8 こちらに一通り書きました https://dev.classmethod.jp/articles/reinvnet-2025-expo-grafana/

Slide 9

Slide 9 text

9 推しはココ Higer-value telemetry, lower costs

Slide 10

Slide 10 text

10 Adaptive Telemetryの主要機能、Metricsの画面

Slide 11

Slide 11 text

11 Adaptive Telemetry とは データの利用状況を自動分析し、使われていないデータの削減や集約を推 奨・実行することで、可観測性を損なわずにノイズを削減 メトリクスやログなどのデータは「とりあえず全部送る」とコストが膨れ上 がりがちですが、この機能を使うことで、価値のあるデータは残し、不要な データは賢く減らすことが可能

Slide 12

Slide 12 text

12 Adaptive Telemetry の主要機能 2023年 • Adaptive Metrics(メトリクスの最適化) • Adaptive Logs(ログの最適化) 2025年10月8日 一般提供開始 • Adaptive Traces(トレースの最適化) 2025年10月8日 Private Preview 開始 • Adaptive Profiles(プロファイルの最適化)

Slide 13

Slide 13 text

13 Adaptive Metrics の使い方

Slide 14

Slide 14 text

14 不要なメトリクスの特定 • 一番上の loki_write_request_... というメトリクスに注目 • 13,000 (13.0K) シリーズ データが発生しているが、実際はほとんど使わ れていない • 右側の『Recommendation impact』にある通り、ワンクリックで 13,000シリーズ分のコストを削減

Slide 15

Slide 15 text

15 RCA workbench

Slide 16

Slide 16 text

16 障害の主要原因をタイムラインで追う • システム全体で何が起きているかを時系列で可視化 • 画面中央のタイムラインを見ると、frontend サービスで大きな障害 (Failure/Error)が起きていることを示していて、います。その下にあ る productcatalogservice など、依存関係にあるサービスの状態も判別可 能 • 通常なら、各サービスのログを個別に検索して突き合わせる作業が必要だ が、ここでは全てのサービスの異常検知(Anomaly)やエラーが1つのタ イムラインに統合

Slide 17

Slide 17 text

17 AIを利用した原因究明

Slide 18

Slide 18 text

18 AIを利用した原因究明 • frontend の赤いエラー部分をクリック • 詳細画面を開くと、具体的に何が閾値を超えているのか(Breach)がリス トアップされ、右側の赤いバーが続いている時間帯が、障害が継続してい る期間 • Adaptive Telemetry で無駄なノイズデータは削減しつつも、障害対応に 必要な重要なシグナルはしっかり残っている • AI(SiftやAsserts)の利用で、このように正確に原因箇所を特定できる

Slide 19

Slide 19 text

19 Grafana Assistant

Slide 20

Slide 20 text

20 詳細はこちらにあります https://dev.classmethod.jp/articles/grafana-assistant-create-dashboard/

Slide 21

Slide 21 text

21 Grafana Assistantのリリースはこちら https://grafana.com/blog/2025/08/14/ai-for-grafana-onboarding-get-your- teams-started-quicker-with-grafana-assistant/

Slide 22

Slide 22 text

22 Grafana Assistant とは Grafana Assistantは、Grafana Cloudに専用のLLMを組み込んだもので、オ ペレーター、開発者、SREがインシデントのトラブルシューティング、ダッ シュボード管理、製品に関する質問への回答を数分で行えるようにします。 Grafana Assistantは、Grafanaインターフェース内で直接インテリジェント でコンテキストを意識したヘルプを提供するエージェント型LLM統合です。 一般的なワークフローを効率化し、質問に答え、オブザーバビリティデータ を最大限に活用できるよう支援します。

Slide 23

Slide 23 text

23 Grafana Assistantの開始方法 2026年1月1日 までは無料で使 えます

Slide 24

Slide 24 text

24 Assistantを使ってみる テキスト入力UIが登 場 - Assistant - Deep Investigation - Dashboarding

Slide 25

Slide 25 text

25 ダッシュボードの作成も可能 「tigerdataデータ ソースのダッシュボ ードを作ってくださ い。 tokyo_werather_ dataというテーブル に時系列で気温、湿 度などが入っている ので、それぞれのパ ネルを作ってくださ い。」

Slide 26

Slide 26 text

26 ダッシュボードの作成も可能 「ダッシュボードの 作り方を学ぶため、 ランダムデータソー スを使った折れ線グ ラフが1つ存在する ダッシュボードを作 成してください」

Slide 27

Slide 27 text

27 ダッシュボードの作成も可能 プレス機に関するデータがリアルタイムで取得できるので、ダッシュボー ドを作ってください。 このダッシュボードは保全用に使用します。 - データソースはまだないので、モックとしてランダムデータソースを使 ってください。それぞれが取るデータの範囲、可視化方法は以下に明示し ます。 - サイクルタイム。単位は秒。データの範囲は10~15秒。 - 最大プレス圧力。単位はトン。データの範囲は90~110トン。 - 金型温度。単位は℃。データ範囲は10~100℃。 - 周囲温度。単位は℃。データ範囲は10~40℃。 - 周囲湿度。単位は%。データ範囲は10~70%。 - 振動加速度。単位はm/s2。データ範囲は0.01~0.1。 - モーター電流値。単位はA。データ範囲は30~80A。 - 騒音レベル。単位はdB。範囲は60~80db。 それぞれ適切なデータ可視化の方法を提案して、それぞれ独立したパネル にしてください。 周囲温度、湿度は最新の値だけ可視化できれば良いです。

Slide 28

Slide 28 text

28 Grafana CloudとGrafana OSSの違い

Slide 29

Slide 29 text

29 そのまんまのページが公式からでてます https://grafana.com/oss-vs-cloud/

Slide 30

Slide 30 text

30 そのまんまのページが公式からでてます https://grafana.com/oss-vs-cloud/

Slide 31

Slide 31 text

31 主な機能の差分(Grafana Cloudで提供されているもの)

Slide 32

Slide 32 text

32 主な機能の差分(Grafana Cloudで提供されているもの)

Slide 33

Slide 33 text

33 Grafana Cloudの進化の方向性 マネージドな部分、特にLLMなどを利用したAI機能は、基本的 にGrafana Cloudの方に寄せられていく方向性にみえる。 (もしかしたらOSS版にローカルLLMとの連携機能がリリースされたりする未来もあるか?) これからのAI活用がGrafanaの中でリリースされていく中で、 OSS版だけではなくGrafana Cloudの進化の方向性も注視してお くのが良い。

Slide 34

Slide 34 text

34 Amazon Managed Grafanaは? 基本的には、Grafana OSS版のAWSマネージドホスト機能として理解するのが良い(各種アシ スタントやAI/ML機能はなし)。 以下の部分はManaged Grafanaのメリット • Amazon CloudWatch logs/metrics、AWS X-Ray traces等とのネイティブ統合 amazon • AWS IAM Identity CenterやSAML 2.0による認証統合 amazon • VPCエンドポイントによるプライベート接続 amazon • Enterpriseプラグインアップグレードにより、ServiceNow、Splunk、Datadog、 Dynatrace等のサードパーティデータソースにも接続可能 ただ、Versionが古かったり(2024年5月に10になったのが最後)するため、使いにくい部分は ある。

Slide 35

Slide 35 text

35 最後に

Slide 36

Slide 36 text

36 Grafana 楽しんでいきましょう! Grafanaは、進化が全くとまらないのでいつも楽しい。 特に近年は、AI/MLをベースとして、Observabilityが 次の領域に入りつつあるなと強く感じます。アツい。 みなさんもどんどん触って、OSSコントリビュートし たり、ブログ書いたり、ミートアップで登壇したりチ ャレンジしてもらえれば。 皆さんの中から、次のGrafana Championの方が登場 するのを楽しみにしています。