Slide 1

Slide 1 text

オブザーバビリティの再考 28th Jun, Jagu'e'r O11y-SRE × CloudNative 『クラウドに依らない O11y』 Kento Kimura

Slide 2

Slide 2 text

自己紹介 ● 所属:Technical Solutions / Sales Engineer ● 担当:パブリッククラウドのアーキテクト知識を活 した  Datadog のプリセールス技術支援 ● 資格:Google Cloud 全 11 資格、AWS 全 12 資格、Azure 13 資格 ● 表彰:Google Cloud Partner Top Engineer 2023-24 Jagu'e'r Award 2023 優秀賞 木村 健人 (Kento Kimura) Datadog Japan GK Technical Solutions Sales Engineering History データセンター運用保守 → パブリッククラウド技術支援 → プリセールス技術支援 Community Jagu’e’r デジクラ人材育成分科会 運営リード O11y-SRE/CloudNative/TechWriters 分科会 運営メンバー Partner Top Engineer 2023 Partner Top Engineer 2024

Slide 3

Slide 3 text

そもそもオブザーバビリティとは

Slide 4

Slide 4 text

Observability = Observe + Ability

Slide 5

Slide 5 text

O11y = Observe + Ability

Slide 6

Slide 6 text

オブザーバビリティとは オブザーバビリティは、システム 運用する上で必要な   内部状態の情報を取得で る状態にあること 「オブザーバビリティ」とは、システム どのような状態に   なったとしても、それ どんなに斬新で奇妙なものであっても、   どれだけ理解し説明で る を示す尺度 オブザーバビリティとは、外部出力の知識 らシステムの   内部状態をどれだけうま 推測で る の尺度 “ “ “ “ “ “ ◆ 引用 ・『オブザーバビリティ・エンジニアリング』https://www.oreilly.co.jp/books/9784814400126/ ・『オブザーバビリティ(可観測性) なぜ必要だと考えるの 』https://ymotongpoo.hatenablog.com/entry/2019/03/25/084500

Slide 7

Slide 7 text

オブザーバビリティへの誤解

Slide 8

Slide 8 text

その①: O11y とは APM である アプリケーションパフォーマンスモニタリング(APM)を行うこと 、 O11y を実現する唯一の手段であると誤解されること ある APM は O11y の手段の1つに過 ず、その他の手段で十分に デバッグ・障害調査・システムの洞察に役立つ情報 取得し利用で ている状態であれば O11y は向上している O11y を検討する際は、APM を導入することを目的にせず、 「システムの状態を把握するために必要な情報は何か」を追求したい

Slide 9

Slide 9 text

その②: O11y はテレメトリーの総称 オブザーバビリティの「3本柱」 ● メトリクス ● ログ ● トレース その他のシグナル ● プロファイラー ● ダンプ ● イベント それぞれのテレメトリーは O11y を実現するための要素 But… O11y は単にテレメトリーの総称ではない!!! O11y を実現するには、テレメトリーを収集するだけでななく それらの相関・可視化を通じて利用可能な状態にする必要がある

Slide 10

Slide 10 text

その③: O11y は難しい こうした課題に対処するための考え方・プラクティス 「オブザーバビリティ」の根幹 「ログを見るだけでは何が起こっているかわからない」 「メトリクスを監視しても問題が起きた後の対処しかできない」 モニタリングや運用を行う上で何かしらの課題があれば、 O11y を実践する目的は既にわかっていて、適切な手段を知るだけ!

Slide 11

Slide 11 text

Thank you