Slide 1

Slide 1 text

⼊⾨ ⼊⾨ 監視 しゃないのえるてぃー⽤ => 外部公開⽤に編集したもの

Slide 2

Slide 2 text

ࣗݾ঺հ • ίωώτגࣜձࣾ • αʔόʔαΠυΤϯδχΞ • ओʹCakePHPͳͲ

Slide 3

Slide 3 text

─室長!
 我々は、老害だったのかもし れませんよ! (金城 2019.01@CTO 1on1)

Slide 4

Slide 4 text

Part 0

Slide 5

Slide 5 text

ΧϯγϜζΧγΫωʁ • ʮ࠷ॳʹर͏ਓʯͱ͔
 ʮຊରԠ͢Δਓʯͱ͔ͷภΓ • ΋͠ʮࣗ෼͕શ͘஌Βͳ͍ػೳʯͰ
 ίέΒΕͨΒɺ٧Ή͔΋͠Εͳ͍ • શһ͕΋ͬͱΰϦΰϦʹ
 Ξϥʔτरͬͯ͘ΕͨΒ޾ͤͩΑͳʙʂ

Slide 6

Slide 6 text

No content

Slide 7

Slide 7 text

ʮೖ໳ ؂ࢹʯ • ͪΐʙͲʮ؂ࢹʂߟ͑ͳ͚Ε͹ʂʂʯͬͯ
 ײ͍ͯͨ࣌͡ظʹʮདྷ݄ൃചʯɻ • ֓ཁͱ͔ಡΜͰͳ͍͚Ͳɺ
 λΠτϧʹऒ͔Εͨͷͱɺ༁ऀ͕৴པͰ͖ͦ ͏ͳͷͱͰδϟέങ͍
 (ձ͕ࣾങͬͯ͘Εͨɺײँʙ)

Slide 8

Slide 8 text

PartⅠ

Slide 9

Slide 9 text

7ߦ·ͱΊ ※ࣾ಺ڞ༗ࡁΈͷʮಡॻϝϞʯΛࢀরʂ

Slide 10

Slide 10 text

PartⅠ
 「⼊⾨ 監視」、どんな本? 〜fin〜

Slide 11

Slide 11 text

Part Ⅱ

Slide 12

Slide 12 text

本に書いてあることは、
 すべて本に書いてあるので

Slide 13

Slide 13 text

本に書いてないことを
 話しましょうよ!!!

Slide 14

Slide 14 text

☓読めばわかること
 ○読んで考えさせられたこと ○読んで感じたこと をば。

Slide 15

Slide 15 text

ざっと、おさらい。
 • 本書のテーマともいうべきポイントを。 • すなわち、
 「こう思ったッス」を話すにあたっての、
 「お気に⼊りポイント」の共有です。

Slide 16

Slide 16 text

おさらい① • 「サービスが動いている」かを監視する。 • メトリクスは、
 ユーザーにとって
 「どういう挙動を引き起こしているか」を
 説明できる項⽬を選定する

Slide 17

Slide 17 text

おさらい② • アラートは
 「誰かを叩き起こす、要アクション」
 なもの。 • ⇔「あとでやれば」なものは、
 アラートと⾔わない。

Slide 18

Slide 18 text

おさらい③ • アラートは「⾒直し、育てる」もの。 • 「⾒たけどアクションしなかったもの」は、 失格!リストラ!外しましょう。

Slide 19

Slide 19 text

おさらい④ • 監視は「スキル」。 • 「役割」にしない!!!

Slide 20

Slide 20 text

(おさらいココまで)

Slide 21

Slide 21 text

我々の「監視」は
 どうだろうか・・・?

Slide 22

Slide 22 text

⼤反省ですよ!! • 我々の作っているのは
 「アラート」ではなかったのかもしれない • 「役割」にはしていない。つもり。
 が、「スキル」=「修得可能なモノ」として
 ⾒えていなかったかもしれない

Slide 23

Slide 23 text

΁ʔ͠Όͱ؂ࢹʙࢲͷೖࣾ࣌ʙ • ࢲͷೖ͔ࣾ࣌ΒSentry͸ೖͬͯΔ • AWS CloudWatch΋ઃఆ͞Ε͍ͯΔ • CTO͕શମతʹݟͯͨ
 -> ࢲ͕ೖ͔ࣾͯ͠Βউखʹπʔϧͷ࢖͍ํΛ ͍֮͑ͯͬͨ

Slide 24

Slide 24 text

΁ʔ͠Όͱ؂ࢹʙΤϯδχΞ૿Ճʙ • (αʔόʔαΠυ)ΤϯδχΞ͕૿͑Δ౓ʹ
 ಉ͡Α͏ͳड͚ೖΕͷྲྀΕΛ౿ऻ • SlackʹʮԿ͔͕ඈΜͰ͘ΔʯΑ͏ʹͯ͠ɺ
 ඈΜͰ͖ͨΒݟΔ • SentryͷIssueΛؾ͕޲͍ͨͱ͖ʹݟΔ

Slide 25

Slide 25 text

΁ʔ͠Όͱ؂ࢹʙ؂ࢹͷڧԽʙ • ϨϙδτϦ΋ਓ΋૿͑ͨͷͰɺ
 ʮSlackʹ௨஌͕དྷͨΒ൓Ԡ͠Α͏ʯ
 ͱ͍͏ͷΛ໌ݴͨ͠ • ͜Ε·Ͱ΋SentryͷΠϕϯτ਺Λ௥͍͕ͬͯͨ
 ʮνʔϜશମͰҙࣝ͠Α͏ʯ
 ͱ͍͏࿩Λͨ͠

Slide 26

Slide 26 text

_⼈⼈⼈⼈⼈⼈⼈⼈⼈⼈⼈⼈⼈⼈⼈⼈⼈⼈⼈⼈_ >                     < > 実質的に、やり⽅変わってないじゃんね  < >                     <   ̄Y^Y^Y^Y^Y^Y^Y^Y^Y^Y^Y^Y^Y^Y^Y^Y^Y^Y^Y^Y^ ̄

Slide 27

Slide 27 text

͕͜͜ʮมΘͬͯͳ͍ʯɻ • 2,3ਓͰશͯΛઃܭɾ࣮૷͍ͯͨ࣌͠୅ͷ
 ʮશ෦๊͖͠Ίͯʂʯܕͷ؂ࢹ • ͳΜͱͳ͘ͷ໨ඪͱͯ͠ͷ
 ʮΤϥʔΛݮΒͦ͏ʂʯͱ͍͏ਫ਼ਆ࿦ • ܅͕ٽ͘ͷͳΒ܅ͷྦ·Ͱา͍͍ͯ͘νʔϜ
 ܅͕ٽ͘·ͰԥΔͷΛ΍Ίͳ͍ঢ়گ

Slide 28

Slide 28 text

No content

Slide 29

Slide 29 text

─室長!
 我々は、老害(ry

Slide 30

Slide 30 text

現状に即し、
 &
 これからに備えねば。

Slide 31

Slide 31 text

そのために
 「今」の姿を分析してみる。

Slide 32

Slide 32 text

我(々)が⾒落としていたもの • 監視なんて誰でもできる!
 俺だって教わってなかったさ!! • 不具合とかエラーなんて出すな!
 それがゼロなら、障害もほとんど起きねぇ!

Slide 33

Slide 33 text

我(々)の思い上がりを
 正すべき、3つの理由

Slide 34

Slide 34 text

ᶃαʔϏε͸
 ʮෳࡶʯʹͳ͍ͬͯΔ • ෳࡶ͞ͱ͸ • ߏ੒ύʔπͷଟ͞ • શମʹର͢Δɺݸʑਓͷʮະ஌ʯྖҬͷ޿ ͞

Slide 35

Slide 35 text

ᶃαʔϏε͸
 ʮෳࡶʯʹͳ͍ͬͯΔ • αʔϏε͕૿͑ͨ͠ɺେ͖͘ͳͬͨ͠ • ػೳ΋૿͑ͨ͠ • ΞʔΩςΫνϟ΋มΘͬͨ͠ • ਓ΋૿͑ͨʂ
 ͦͯ͠ɺਓͦΕͧΕʮઐ໳Խʯ͍ͯ͠Δ͠

Slide 36

Slide 36 text

ᶄϝϯόʔ΋૿͑ͨ • ো֐ͷʮݱ৔ʯʹग़ಈ͢Δ֬཰͕ݮ͍ͬͯΔ • ҎલͷΑ͏ʹ
 “࣮ࡍʹରԠ͔ͨ͠ΒମͰ֮͑ͨ”͸
 ظ଴Ͱ͖ͳ͘ͳ͍ͬͯΔ

Slide 37

Slide 37 text

ᶅαʔϏε͕҆ఆ͍ͯ͠Δ • ͍΍ɺྑ͍Μ΍Ͱɻͱͯ΋ɻ
 Ͱ΋ɺͦΕ͕ނʹɾɾɾɾ • ʮ؂ࢹΞϯνύλʔϯʯΛ༠ൃ͞ΕΔ • ʮ͍ͭ΋ಉ͡ਓʯͰͲ͏ʹ͔ͳΔ • ʮݫ͠໨ʹर͓ͬͯ͜ʂʯ͕Ͱ͖ͪΌ͏

Slide 38

Slide 38 text

今の所、
 まぁコレでOKだと思う

Slide 39

Slide 39 text

コレからも
 同じこと⾔えるの・・・?

Slide 40

Slide 40 text

圧倒的に、
 “⾒直し”が⾜りていないのでは。

Slide 41

Slide 41 text

No content

Slide 42

Slide 42 text

Part Ⅱ
 弊社監視⼤反省会 〜fin〜

Slide 43

Slide 43 text

Part Ⅲ

Slide 44

Slide 44 text

⼊⾨ 監視を読んだ感想: 
 我々も「⼊⾨」をしていこう。

Slide 45

Slide 45 text

コネヒト的
 脱⽼害計画
 監視⺠主化運動

Slide 46

Slide 46 text

ママリの「監視」の現状を
 本にあった⾔葉を使ってまとめてみる 1. 「敏感」なアラートが多い • 「影響度の判断」「問題の切り分け」が
 属⼈的になりがち 2. 「ユーザー観点 / ビジネスKPI」への
 メトリクス結びつけが弱い • 「実際にどう影響してる?」の想像できてる? 3. ツールの使い⽅・読み⽅は、勝⼿に覚えてね! • でもさ、なんでも
 「巻き込まれる」まで、学習意欲ってわかないよね

Slide 47

Slide 47 text

ママリの「監視」の現状を
 本にあった⾔葉を使ってまとめてみる 4. 「開発者も監視に取り組む」は できている! • OSレイヤ・インフラレイヤのアラートも
 「このリリース、施策が原因かな?」って
 結びつけて考えてはいるよね 5. FTSを上げる⽂化 • 少なくとも「チームの学習」に転化する意識はある

Slide 48

Slide 48 text

どうすれば、
 良くなっていきそうか?

Slide 49

Slide 49 text

ʮ؂ࢹΛຽओԽ͢Δʯ • ʮαʔϏε͸ෳࡶʹͳ͍ͬͯ͘ʯͱ͍͏લఏΛ࣋ͭ ‣ ଐਓੑ͚ͩͰ͸ཱͪ޲͔͑ͳ͘ͳΔ • ؂ࢹΛʮγϯϓϧʯʹ͢Δ ‣ ϢʔβʔӨڹΛத৺ʹਾ͑ͯɺରԠ͢΂͖໰୊Λ໌֬ʹ͢Δ • ʮ෼͔Γ΍͢͞ʯΛҭΉ ‣ ઐ໳తͳ؍఺͔Βͷ૬ޓڠྗΛࢧԉ͢ΔͨΊɺ
 ֤ϝϯόʔ͕ಉ͡ࢹ࠲Ͱঢ়گΛಡΈऔΕΔঢ়گΛ࡞Δ

Slide 50

Slide 50 text

端的に問題は何なの? 1. アラートが「多い」 2. アラートが「複雑」で、それゆえに対応が「⾼度」 3. 複雑さや⾼度さに対処するための組織的なサポートがない 4. 2・3の相互的な悪循環 5. 4のために「役割」が固定されていく 6. 5のために「敏感なアラート」が増え、棚卸しが⾜りない

Slide 51

Slide 51 text

ママリの「監視」の未来を
 思い描いてみる 1. アラートを「シンプル」にする • 「アラートじゃないもの」は別にしよう! • ソフトウェアの品質の観測は、別個の問題として向き合う 2. ユーザーストーリーに⽴脚したメトリクス • 「この項⽬ → リアルユーザーの被る影響はこう!!」を
 想像できるようにする 3. 「全員監視」のためのトレーニング • ツールやナレッジのインプット • 障害対応後の振り返り・共有の充実化

Slide 52

Slide 52 text

⽬指せ!
 脱⽼害で、安⼼安全な世界! 監視全体のリデザインのための
 ロードマップを作っていますなう

Slide 53

Slide 53 text

2019年は “組織での”監視に、
 ⼊⾨していきましょう!!