Slide 1

Slide 1 text

ja.mackerel.io 2025.9.24 Mackerel CREとして APMに向き合ってきた話 第27回Customer系エンジニア座談会 株式会社はてな Mackerel CRE kmuto(武藤 健志)

Slide 2

Slide 2 text

こんばんは、Mackerel CREのkmutoです ● 武藤 健志(ムトウ ケンシ) ○ Xなど @kmuto ● 株式会社はてな Mackerel CRE(Customer Reliability Engineer: 顧客信頼性エンジニア) カスタマーサクセスユニット、 Mackerel CREチームテックリード ● 第14回 Customer系エンジニア勉強会(2023年2月)で 『書籍編集者からCREへ転身してみた』にて発表 2

Slide 3

Slide 3 text

MackerelとCRE ● Mackerel https://ja.mackerel.io ○ オブザーバビリティプラットフォームのSaaS ○ サーバーやサービスが正しく動いていることの監視を提供 ● CREは、Mackerelを使う顧客の成功を支援するエンジニアとして、 顧客と直接対話しながら多方面に活動 ○ 導入前の懸念解消 ○ オンボーディング支援 ○ 導入後活用支援 3

Slide 4

Slide 4 text

オブザーバビリティという進路、 APMというツール ● Mackerelは「オブザーバビリティプラットフォーム」となることを 宣言(2024年8月) ● これまでの主軸の「サーバー監視」に、「アプリケーションの洞察」 という新たな軸を建立する ● その洞察のツールが「APM(アプリケーションパフォーマンス モニタリング)」 ○ および現在MackerelがAPMの中核としている「トレース」 4

Slide 5

Slide 5 text

なぜAPMが必要? ● クラウド・コンテナ・マイクロサービスと いった技術で、現代のアプリケーションは 堅牢になっているが複雑性は増加 ● 「レスポンスが遅い」「どこかでエラーになっている」の異常の発生は 検知できても、なぜそうなったのかの原因を探るのが困難 ● 本番環境で、開発時には思いもよらなかった形で発生する ● 「アプリケーションのどこで異常が起きたか」「どのような経緯でそう なったか」「異常に至る特定の傾向はあるのか」 ⇒ 従来のサーバー監視では満足な答えを出せない 5

Slide 6

Slide 6 text

APMが提供する機能例:監視から洞察へ ● HTTPサーバーのエンドポイントごとのレイテンシーやエラー率、 呼び出し頻度 ● データベースのクエリごとのレイテンシー、呼び出し頻度 ● 分散サービスにおいての根本的なエラー発生原因や傾向 6

Slide 7

Slide 7 text

ロードマップを定める:最速伝説 ● ミッション:顧客の関心の喚起 → トライアル顧客獲得とその支援 ● 「APMとは?🤔」「トレースとは?🤔」からのスタート 7 APMの知識を獲得する 顧客のAPMトライアルを支援する APMを顧客に提案する 最速でこれを 達成しないと

Slide 8

Slide 8 text

APMの知識を獲得する:読み、試し、記す ● 開発チームや社内SREからのレクチャーを受ける / YouTubeやUdemyの セミナーで学ぶ ● 他社のAPM説明を読む / 書籍を読む(査読もする) / 先達のブログを漁り読む ● OSSのデモ(OpenTelemetry Demo)やツール(Jaeger、 Grafana、SigNozなど)を試す / トレースを投稿するコード を書いてみる / 各開発言語向けのSDK実装とフレーム ワークを試して比較してみる ● 学んだことをブログに書いて公開する 8 z『実践OpenTelemetry』 Daniel Gomez Blanco 著、 大谷 和紀 訳、 オライリージャパン

Slide 9

Slide 9 text

APMを顧客に提案する:技術を使い、技術で語る ● トレースの説明用デモとトークスクリプトの作成 ● 提案資料の作成 ● 分散トレーシングハンズオンの作成・実施 ● 自動実行型APMデモの設計と実装、 トークスクリプトの作成 ● 新規顧客・既存顧客との商談や展示会で紹介・説明 ● 顧客の課題に対しての提案 9

Slide 10

Slide 10 text

顧客のAPMトライアルを支援する:伴走するCRE ● トライアル申し込み顧客へのCRE支援 ○ 顧客がAPMで達成したいことが達成できるよう支援に尽力する ● 要件ヒアリング、進捗確認 ● プロアクティブなドキュメントの作成と提供 ● サンプルコードの作成 ● 検証、ベストプラクティスの提案 ● Mackerelの機能不足・わかりにくさ・不具合箇所の実装の働きかけ 10

Slide 11

Slide 11 text

APMへの向き合いと今後 ● 新たな技術・ツールに対し、手探りしながら全力で駆け抜けてきた ● APMやMackerelの進化に合わせて、学び続け、自身の知識・技術を アップデートし続ける ● CRE=顧客信頼性エンジニアとして、ただツールを提供するだけ でなく、顧客とともに学びながら顧客のサービスの成功を支援 していく 11 Happy Hacking!