Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
トイル撲滅から始める改善手法とその結果
Search
Sponsored
·
SiteGround - Reliable hosting with speed, security, and support you can count on.
→
yjszk
February 09, 2024
Technology
0
2k
トイル撲滅から始める改善手法とその結果
https://findy.connpass.com/event/308162/
yjszk
February 09, 2024
Tweet
Share
More Decks by yjszk
See All by yjszk
バッチ処理を監視したいだけなんだが…
yjszk
7
2.5k
技術発信を続ける難しさを行動で乗り切る
yjszk
1
1.6k
創造的活動から切り拓く新たなキャリア 好きから始めてみる夜勤オペレーターからSREへの転身
yjszk
1
400
強すぎるIAMをCloudTrailを使って適正化した話
yjszk
0
510
DMARCレポートの可視化ツールの作成と運用した結果
yjszk
0
250
リブセンスのソリューションチームについて
yjszk
0
980
設計という共通認識
yjszk
0
1k
LT駆動生活
yjszk
1
1.4k
Other Decks in Technology
See All in Technology
OCI Security サービス 概要
oracle4engineer
PRO
2
13k
プロジェクトマネジメントをチームに宿す -ゼロからはじめるチームプロジェクトマネジメントは活動1年未満のチームの教科書です- / 20260304 Shigeki Morizane
shift_evolve
PRO
1
130
オンプレとGoogle Cloudを安全に繋ぐための、セキュア通信の勘所
waiwai2111
3
1.1k
Shifting from MCP to Skills / ベストプラクティスの変遷を辿る
yamanoku
4
680
類似画像検索モデルの開発ノウハウ
lycorptech_jp
PRO
4
1k
JAWS DAYS 2026 CDP道場 事前説明会 / JAWS DAYS 2026 CDP Dojo briefing document
naospon
0
200
AIエージェント時代に備える AWS Organizations とアカウント設計
kossykinto
2
320
Claude Codeの進化と各機能の活かし方
oikon48
19
8.9k
越境する組織づくり ─ 多様性を前提にしたチームビルディングとリードの実践知
kido_engineer
2
140
作りっぱなしで終わらせない! 価値を出し続ける AI エージェントのための「信頼性」設計 / Designing Reliability for AI Agents that Deliver Continuous Value
aoto
PRO
1
200
Databricksアシスタントが自分で考えて動く時代に! エージェントモード体験もくもく会
taka_aki
0
350
【SLO】"多様な期待値" と向き合ってみた
z63d
2
310
Featured
See All Featured
Balancing Empowerment & Direction
lara
5
930
Design of three-dimensional binary manipulators for pick-and-place task avoiding obstacles (IECON2024)
konakalab
0
380
DBのスキルで生き残る技術 - AI時代におけるテーブル設計の勘所
soudai
PRO
62
51k
Agile Actions for Facilitating Distributed Teams - ADO2019
mkilby
0
140
The Limits of Empathy - UXLibs8
cassininazir
1
250
The Success of Rails: Ensuring Growth for the Next 100 Years
eileencodes
47
8k
[RailsConf 2023] Rails as a piece of cake
palkan
59
6.4k
Mind Mapping
helmedeiros
PRO
1
110
Improving Core Web Vitals using Speculation Rules API
sergeychernyshev
21
1.4k
Claude Code のすすめ
schroneko
67
220k
Paper Plane (Part 1)
katiecoart
PRO
0
5.2k
Leadership Guide Workshop - DevTernity 2021
reverentgeek
1
230
Transcript
トイル撲滅から始める改善⼿法とその結果 2024/02/14 TechBrew in 東京 〜SRE⼤集合!信頼性を⾼める取り組み〜 株式会社リブセンス 技術部インフラG 鈴⽊裕⼆(@yjszk666) Copyright
© Livesense Inc.
0. 自己紹介 Yuji Suzuki(@yjszk666) Copyright © Livesense Inc. • 株式会社リブセンスでSRE的なしごとしてます
◦ 2023/2 〜 ◦ 採⽤広報(ブログ運営etc..)もしてる • 趣味:公営競技の鑑賞、ホームは平塚競輪 • 略歴 ◦ ⼤学無内定卒業→フリーター ▪ 占い師とか出版社で校正とか⾊々 ◦ ⾦融SE ◦ 夜勤オペレータ ◦ SIer ◦ コンサルでSE ◦ リブセンス
1 2 3 4 誰もやりたがらない仕事、トイル 事例1:脆弱性対応の⾃動化 事例2:放置された理想の認証システム トイル解消がもたらす組織への影響 Copyright ©
Livesense Inc.
誰もやりたがらない仕事、トイル SECTION 1 Copyright © Livesense Inc.
1. 誰もやりたがらない仕事、トイル そもそも信頼性ってなんだろ? JISによると、 >アイテムが与えられた条件で規定の期間中、要求された機能を果たすこができる性 質、及び、その定量的な尺度である信頼度 ざっくりいうとちゃんと動いていることですね 信頼性向上ってなんや Copyright © Livesense
Inc.
1. 誰もやりたがらない仕事、トイル • これを担保するには、SRE本によると… ◦ 監視/計測して定量的に数字で判断、SLA/SLO/SLIなどなど ◦ こういうかっこいいやつ、正直できてませんw • 計測の前段…
◦ 計測前の深いところに信頼性を向上させるヒントがある気がした ◦ それを邪魔するのにトイルがあるんじゃないかと思った 信頼性向上ってなんや Copyright © Livesense Inc.
1. 誰もやりたがらない仕事、トイル • トイルってなに?🧐 ◦ >トイルとは、プロダクションサービスを動作させることに関係する…(略) ◦ ここでは誰もやりたがらない仕事と定義します ◦ 会議中に発⾒して共有するとネットリとした雰囲気が漂うアレです
• 作業そのものが⻑期的な価値を⽣み出さないししんどい⼿作業が多い印象です トイルってなんや Copyright © Livesense Inc.
1. 誰もやりたがらない仕事、トイル • SRE本によると… ◦ これをなくすと本来の作業に集中できて信頼性があがる😤 ◦ でも理想論じゃねこれ • 誰もやらないので窓サッシのホコリみたいに溜まりがち
◦ 誰も球を持たないので落ちたボールとか⾔われてる ◦ これをあえてやります トイルってなんや Copyright © Livesense Inc.
事例1:脆弱性対応の⾃動化 SECTION 2 Copyright © Livesense Inc.
Before:週次で⼿動アサインしていた 2.脆弱性対応の自動化 Copyright © Livesense Inc. • ⽇次でissueが切られる ◦ InspectorのAPIを利⽤
• 週次MTGでランダムアサイン • 対応 ◦ 各⾃調べてssh🤮 ◦ コマンド実⾏🤮
2.脆弱性対応の自動化 このように脆弱性対応はめんどくさい しかも積極的にやってもバリュー出ない でもやらないと正直やばい (※) 遅効性の毒みたいな存在&トイルだこれ… ※脆弱性を放置するとシステムに障害が起き、サイト信頼性が低下するかも… Copyright © Livesense
Inc.
After:まずは情報を多くした 2.脆弱性対応の自動化 Copyright © Livesense Inc. • CODEOWNERSからランダムアサイン • これだけでもMTGの時間が短くなった
2.脆弱性対応の自動化 InspectorのAPIから推奨コマンドが取れる でも⾃動アプデは依存性が怖い😱 半⾃動化にもワンステップ欲しい Copyright © Livesense Inc.
After:コメントするとSSM Run Commandで実⾏するように 2.脆弱性対応の自動化 Copyright © Livesense Inc. • /executeって書くと実⾏
◦ 結果もコメントでペタ • 5分かかる作業が1分で終了 ◦ チケットが多い⽉はうれしい ▪ 30くらいある時もある • 誰がやったかわかるから監査もOK
2.脆弱性対応の自動化 MTG短くなり他のことに時間を使える++ 複数⼈から喜びの声、これが⼀番嬉しい そして⽉2時間程度(※)の時間が地味に削減された ※4分✖30チケット 脆弱性を放置しないことで信頼性向上に繋がる Copyright © Livesense Inc.
2.脆弱性対応の自動化 なんで放置されてたのか考えてみる🤔 当時からクラウド移⾏中でした そのうちマネージドサービスに寄せるし、 いまやらなくてもいいか… という、思考 → これがよくない Copyright © Livesense Inc.
事例2:放置された理想の認証システム SECTION 3 Copyright © Livesense Inc.
乱⽴していた社内の認証を統合するプロジェクトがありました。 しかし、中途半端に実装された状態で頓挫😭 作者も退職してよくわからない状態で3年も放置されており、更に当時技 術投資で作られたのか、会社で標準的に使われてない技術なのも放置に拍 ⾞をかけていました アツい思いで作られたが頓挫、作者が退職、その後放置 3.放置された理想の認証システム Copyright © Livesense
Inc.
• というのもあり、誰もが⾒て⾒ぬフリをしていた… ◦ そこをあえて観測(み)てみると…👁 • 過剰なプロビジョニングが放置されていた! アツい思いで作られたが頓挫、作者が退職、その後放置 3.放置された理想の認証システム Copyright ©
Livesense Inc.
• 実装当初、広く使われるのを意識したのか⼤きいプロビジョニングに • 実態は1週間でDBに7コネクションしかアクセスない • 直しました、結果、⽉額4-5万円の削減に😤 ◦ EC2はm5.largeをt3.smallに ◦ RDSはdb.m5.largeをdb.t3.smallに
アツい思いで作られたが頓挫、作者が退職、その後放置 3.放置された理想の認証システム Copyright © Livesense Inc.
• なぜ触られなかったのか? ◦ 今はCIでTerraformを動かしているがCICD未整備時代のブツ ◦ オペレーションサーバーに⼊るのに多段SSHでめんどくさい アツい思いで作られたが頓挫、作者が退職、その後放置 3.放置された理想の認証システム Copyright ©
Livesense Inc.
3.放置された理想の認証システム なんで放置されてたのか考えてみる🤔 めんどうだしいまやらなくてもいいか… 結局これに尽きる めんどうはわかるがいつかはやらないとダメ この雰囲気を変えていきたいと思う Copyright © Livesense Inc.
トイル解消がもたらす組織への影響 SECTION 4 Copyright © Livesense Inc.
• トイル解消すると、今まで問題を問題と気づかなかった⼈々が気づく ◦ トイルとして認識されてない場合、ここがスタートとなる • こういうめんどい作業を新⼈がやると… ◦ コスい話、ベテラン層へのエンゲージメントになる(気がする) ◦ より強いマンパワーでトイルへ向き合うことが可能に
誰もやらないことをやると空気が変わる 4.トイル解消がもたらす組織への影響 Copyright © Livesense Inc.
• このような空気は計測不可能 ◦ 空気にSLOはない • 計測以前に作るべき⼟壌が作れる ◦ 例えば、先ほどのマンパワーを⽤いて、仕組み的にトイル解消😤な ど 誰もやらないことやると空気が変わる
4.トイル解消がもたらす組織への影響 Copyright © Livesense Inc.
• ⼊ったばっかりの時にトイル解消は実はおすすめ ◦ どこがエンジニアリングのボトルネックになっているのかわかる ▪ 改善の勘所が鍛えられる ◦ 古い資料とかコードを漁りまくるのでドメイン知識がつく • ただ…
新⼈がやるトイル解消のすすめ 4.トイル解消がもたらす組織への影響 Copyright © Livesense Inc.
• 作業として⾯⽩くない ◦ が、誰もやらない領域を攻めるので⾃分の武器ができる ◦ これをチームに展開するとさらにプラス ▪ ここでサイロ化しては元も⼦もない • バリューを出すトイル解消
◦ 盲⽬的にトイルに取り組むのではバリューは出ないが、 ◦ このように⾃動化‧改善することでバリューは出る!😤 新⼈がやるトイル解消のすすめ 4.トイル解消がもたらす組織への影響 Copyright © Livesense Inc.
• こういう姿勢で仕事してると良いことが… ◦ 表彰されました! • ⼈間としての信頼性も向上したか!? ◦ サイト信頼性も⼤事だがヒューマン信頼性もっ と⼤事な気がする 余談
4.トイル解消がもたらす組織への影響 Copyright © Livesense Inc.
4.トイル解消がもたらす組織への影響 信頼性向上、いろいろあるけど ⾃分としては⾯⽩くない仕事(=トイル)を いかに楽しくするかという基本に帰結する そしてトイル撲滅でコア業務に集中😤 これが俺の信頼性向上だ! Copyright © Livesense Inc.
最後に… ‧計測⚖ ‧監視👁 今後はこの辺りを頑張ります🙇 Copyright © Livesense Inc.
ありがとうございました Copyright © Livesense Inc.
None
None