Upgrade to Pro — share decks privately, control downloads, hide ads and more …

こつこつ育てるSLO

 こつこつ育てるSLO

2024年12月10日に開催された『2024.12.10@株式会社ユーザベース×株式会社ZOZO×株式会社PR TIMES 3社合同フロントエンド勉強会』で登壇した際の資料です。 #zup_frontend
https://prtimes.connpass.com/event/335335/

Other Decks in Technology

Transcript

  1. こつこつ育てる SLO
 NewsPicks, BDD Product Team, Software Engineer / ニッシー☆


    2024.12.10@株式会社ユーザベース×株式会社ZOZO×株式会社PR TIMES 3社合同フロントエンド勉強会 #zup_frontend

  2. 00
 自己紹介
 ニッシー☆ / Uzabase, Inc.
 NewsPicks, BDD Product Team,

    Software Engineer
 23年度新卒。ソーシャル経済メディア「NewsPicks」のWebリニューアルを 24年10月まで従事。現在は経済・ビジネス情報に特化した動画配信サー ビス「NewsPicks Stage.」にてプロダクト開発を行っている。肉🍖と日本 酒🍺が大好き。
 𝕏:@yukinissie
 ©Uzabase Inc. All Rights Reserved.

  3. 1. 私の考える理想の開発現場が取る行動 
 2. オブザーバビリティと SLOの関係
 3. SLOの改善事例とその学び 
 3.1.

    SLOの名前から何の信頼性を見ているのか分からない 
 3.2. SLIが冗長で無駄なアラートが多く認知負荷になっていた 
 3.3. SLOを振り返らず初期の目標をずっと見ていた 
 4. まとめ
 00
 目次
 ©Uzabase Inc. All Rights Reserved.

  4. 00
 AWS re:Invent 2024 に参加しました! 
 AWS で1番大きな国際的技術イベント! 毎年アメリカのラスベガスで行われ、世界 中のIT従事者が一挙に集まる。基調講演

    や技術セッションなどで最新の技術や サービスを知ったり自身が興味を持つ技 術分野やサービスに関する知識を深める ことができる。人脈を広げる機会も多い し、それ以外にもお土産やダンスパー ティーなどお楽しみ要素がたくさん! 
 ©Uzabase Inc. All Rights Reserved.

  5. こつこつ育てる SLO
 NewsPicks, BDD Product Team, Software Engineer / ニッシー☆


    2024.12.10@株式会社ユーザベース×株式会社ZOZO×株式会社PR TIMES 3社合同フロントエンド勉強会 #zup_frontend

  6. 1. 私の考える理想の開発現場が取る行動 
 2. オブザーバビリティと SLOの関係
 3. SLOの改善事例とその学び 
 3.1.

    SLOの名前から何の信頼性を見ているのか分からない 
 3.2. SLIが冗長で無駄なアラートが多く認知負荷になっていた 
 3.3. SLOを振り返らず初期の目標をずっと見ていた 
 4. まとめ
 00
 目次
 ©Uzabase Inc. All Rights Reserved.

  7. 00
 NewsPicks における働き方 -「全員プロダクト開発エンジニア」 
 「全員プロダクト開発エンジニア」 という価 値感のもと、さまざまな領域をオーバー ラップして活躍しているエンジニアが多数 在籍しています。エンジニアが個人の得意

    領域にコミットすることはもちろん、 課題発 見から開発・運用まで 、チーム一丸となっ てフルサイクルで プロダクトに向き合って います。
 ©Uzabase Inc. All Rights Reserved.

  8. 00
 NewsPicks における働き方 -「最高の開発者体験の追求」 
 私たちは、最高の開発者体験がユーザー価 値の向上に繋がる という考えのもと、常に開 発環境を改善 しています。安全かつ高速な

    デプロイ、待たない・困らない開発環境、一 貫した意思決定のためのオープンコミュニ ケーション、データの民主化 を推進していま す。また、開発者のワクワク感を醸成するた め、Kotlin推進やアーキテクチャの刷新に取 り組んでいます。
 ©Uzabase Inc. All Rights Reserved.

  9. 01
 当時の悩み。。。 
 弊社ではすでにオブザーバビリティの準備が備わっており、SLOの設定もさ れていたが以下の悩みがあった。
 • 開発に集中できないくらいSLOアラートがたくさん鳴っている。。
 • アラートを見てもどのユーザーがどのように困っているかよくわからな い。。


    • アラートの原因調査に割と工数を割くことに。。
 →ユーザー価値を産めないし、ユーザーの困りごとにすぐに気づけない!
 ©Uzabase Inc. All Rights Reserved.
 ※SLOとはサービスの信頼性を測定するための目標値のこと
  10. 01
 悩んでいたときに読んだブログ 
 「SLO は、チームがやるべきことについて意味のある疑念を解決する便利 なツールとなります。「この課題には絶対取り組まなくては」 ということと、「こ の課題には取り組まなくていいかもしれない」 ということの間に線引きするこ とこそが目標

    なのです。」 ↑Google Cloudのブログ『優れた SLO を策定するには : CRE が現場で学んだこと 』より ≒必要な時だけ、今、開発するか運用するかの意思決定がしやすくなる! (意訳) →ユーザーに価値ある機能を継続的に爆速で届ける一助 にSLOの改善が あるのではないか? ©Uzabase Inc. All Rights Reserved.

  11. 1. 私の考える理想の開発現場が取る行動 
 2. オブザーバビリティと SLOの関係
 3. SLOの改善事例とその学び 
 3.1.

    SLOの名前から何の信頼性を見ているのか分からない 
 3.2. SLIが冗長で無駄なアラートが多く認知負荷になっていた 
 3.3. SLOを振り返らず初期の目標をずっと見ていた 
 4. まとめ
 00
 目次
 ©Uzabase Inc. All Rights Reserved.

  12. 02
 ここまでのまとめ 
 • SLOを設定すれば必要な時だけ、今、開発するか運用するかの意思 決定がしやすくなる のでは?!(意訳) • オブザーバビリティーのデータを利用することで正確でデバッグ容易 なSLOを設定できる!

    • 現状、SLOの設定周りで改善の余地を感じている。。 • SLOを改善すれば、ユーザーに価値ある機能を継続的に爆速で届け る一助に繋がるかも! ©Uzabase Inc. All Rights Reserved.

  13. 1. 私の考える理想の開発現場が取る行動 
 2. オブザーバビリティと SLOの関係
 3. SLOの改善事例とその学び 
 3.1.

    SLOの名前から何の信頼性を見ているのか分からない 
 3.2. SLIが冗長で無駄なアラートが多く認知負荷になっていた 
 3.3. SLOを振り返らず初期の目標をずっと見ていた 
 4. まとめ
 00
 目次
 ©Uzabase Inc. All Rights Reserved.

  14. 1. 私の考える理想の開発現場が取る行動 
 2. オブザーバビリティと SLOの関係
 3. SLOの改善事例とその学び 
 3.1.

    SLOの名前から何の信頼性を見ているのか分からない 
 3.2. SLIが冗長で無駄なアラートが多く認知負荷になっていた 
 3.3. SLOを振り返らず初期の目標をずっと見ていた 
 4. まとめ
 00
 目次
 ©Uzabase Inc. All Rights Reserved.

  15. 1. 私の考える理想の開発現場が取る行動 
 2. オブザーバビリティと SLOの関係
 3. SLOの改善事例とその学び 
 3.1.

    SLOの名前から何の信頼性を見ているのか分からない 
 3.2. SLIが冗長で無駄なアラートが多く認知負荷になっていた 
 3.3. SLOを振り返らず初期の目標をずっと見ていた 
 4. まとめ
 00
 目次
 ©Uzabase Inc. All Rights Reserved.

  16. 1. 私の考える理想の開発現場が取る行動 
 2. オブザーバビリティと SLOの関係
 3. SLOの改善事例とその学び 
 3.1.

    SLOの名前から何の信頼性を見ているのか分からない 
 3.2. SLIが冗長で無駄なアラートが多く認知負荷になっていた 
 3.3. SLOを振り返らず初期の目標をずっと見ていた 
 4. まとめ
 00
 目次
 ©Uzabase Inc. All Rights Reserved.

  17. 04
 まとめ
 • SLOを設定すれば必要な時だけ、今、開発するか運用するかの意思 決定がしやすくなるのでは?! (意訳) • オブザーバビリティーのデータを利用することで 正確でデバッグ容易な SLOを設定できる!

    • わかりやすい SLO名、分散トレースを活用した SLOの数の削減 、定期 的なメンテナンス の実行でSLOを改善! • SLOを改善すれば、ユーザーに価値ある機能を継続的に爆速で届け る一助に繋がるかも! ©Uzabase Inc. All Rights Reserved.

  18. 02
 参考文献
 • Google Cloudのブログ『優れた SLO を策定するには : CRE が現場で学んだこと

    』 • 書籍『オブザーバビリティ・エンジニアリング 』
 • 書籍『SRE サイトリライアビリティエンジニアリング 』
 • 書籍『サイトリライアビリティワークブック 』
 • 書籍『入門 監視』
 • 書籍『アジャイルサムライ――達人開発者への道』
 • 書籍『LeanとDevOpsの科学』
 ©Uzabase Inc. All Rights Reserved.