R I T Y U N K N O W N 02:47 深夜、アラートが鳴る。 布団から起き上がり、調査がはじまる―― 01 アラートの内容を確認する 02 New Relic にログインして 関連エンティティを探る 03 原因 ・ 影響範囲を特定して トリアージ 04 Slackに報告して布団に戻る 調査結果: 一 時的な問題。サービス影響なし。 · そのあと:脳が覚醒、なかなか寝付けない…😳 この調査、最初からAIがやってくれたら… お布団から出る回数が減らせるのでは?? 04 / 16 #NRUG_SRE
革 命的に楽になる B E F O R E 手 動でエンティティを渡り歩く × New Relicにログイン × 関連エンティティを探して開く × 各エンティティを渡り歩いて調査 × 色 々と知識が必要なこともある(NRQL等) × 時間がかかる! ▶︎ A F T E R 「過去1週間の問題を教えて」 ✓ 自 然 言 語で簡単に調査依頼 ✓ 複数エンティティを横断して調査 ✓ NRQLや深い知識がなくても 大 丈夫! 08 / 16 #NRUG_SRE
/ After SRE 障害対応を 高 速に横断調査 B E F O R E APM → ログ → 別サービスを 手 動で渡り歩く 相関は 手 作業で組み 立 て(数 十 分かかることも) A F T E R 「障害の原因を調べて」 → 複数エンティティを横断し、ボトルネックを 自 動特定 横断調査を 自 動化し、調査時間を 大 幅短縮 割り込み対応が減り、信頼性改善に集中 Dev 開発者が 自 分で原因調査 B E F O R E Dev「このエラー何ですか?」→ SREにSlackで質問 SREが調査して回答(待ち時間が発 生 ) A F T E R 「エラーレートが上昇、原因は?」 → MCPやSRE Agentに直接問い合わせ、原因を特定 NRQL不要 ・自 然 言 語で、 自 分で原因に到達 SRE待ちゼロで開発を 止 めない 13 / 16 #NRUG_SRE ⚡ 専 門 知識(NRQL)不要 — 自 然 言 語で誰でも調査できる「調査の 民 主化」 SRE も Dev も、調査時間を 大 幅短縮して本来の仕事に集中できる! P O I N T