Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
トイル撲滅から始める改善手法とその結果
Search
yjszk
February 09, 2024
Technology
0
1.7k
トイル撲滅から始める改善手法とその結果
https://findy.connpass.com/event/308162/
yjszk
February 09, 2024
Tweet
Share
More Decks by yjszk
See All by yjszk
強すぎるIAMをCloudTrailを使って適正化した話
yjszk
0
310
DMARCレポートの可視化ツールの作成と運用した結果
yjszk
0
69
リブセンスのソリューションチームについて
yjszk
0
700
設計という共通認識
yjszk
0
670
LT駆動生活
yjszk
1
970
Other Decks in Technology
See All in Technology
隣接領域をBeyondするFinatextのエンジニア組織設計 / beyond-engineering-areas
stajima
1
270
DMARC 対応の話 - MIXI CTO オフィスアワー #04
bbqallstars
1
160
マルチモーダル / AI Agent / LLMOps 3つの技術トレンドで理解するLLMの今後の展望
hirosatogamo
37
12k
SREが投資するAIOps ~ペアーズにおけるLLM for Developerへの取り組み~
takumiogawa
1
100
【Startup CTO of the Year 2024 / Audience Award】アセンド取締役CTO 丹羽健
niwatakeru
0
960
Why does continuous profiling matter to developers? #appdevelopercon
salaboy
0
180
OCI Security サービス 概要
oracle4engineer
PRO
0
6.5k
エンジニア人生の拡張性を高める 「探索型キャリア設計」の提案
tenshoku_draft
1
120
スクラム成熟度セルフチェックツールを作って得た学びとその活用法
coincheck_recruit
1
140
The Role of Developer Relations in AI Product Success.
giftojabu1
0
120
ExaDB-D dbaascli で出来ること
oracle4engineer
PRO
0
3.8k
AIチャットボット開発への生成AI活用
ryomrt
0
170
Featured
See All Featured
Keith and Marios Guide to Fast Websites
keithpitt
409
22k
Navigating Team Friction
lara
183
14k
"I'm Feeling Lucky" - Building Great Search Experiences for Today's Users (#IAC19)
danielanewman
226
22k
GitHub's CSS Performance
jonrohan
1030
460k
Code Reviewing Like a Champion
maltzj
520
39k
Cheating the UX When There Is Nothing More to Optimize - PixelPioneers
stephaniewalter
280
13k
I Don’t Have Time: Getting Over the Fear to Launch Your Podcast
jcasabona
28
2k
The Pragmatic Product Professional
lauravandoore
31
6.3k
Evolution of real-time – Irina Nazarova, EuRuKo, 2024
irinanazarova
4
370
How STYLIGHT went responsive
nonsquared
95
5.2k
A designer walks into a library…
pauljervisheath
203
24k
Mobile First: as difficult as doing things right
swwweet
222
8.9k
Transcript
トイル撲滅から始める改善⼿法とその結果 2024/02/14 TechBrew in 東京 〜SRE⼤集合!信頼性を⾼める取り組み〜 株式会社リブセンス 技術部インフラG 鈴⽊裕⼆(@yjszk666) Copyright
© Livesense Inc.
0. 自己紹介 Yuji Suzuki(@yjszk666) Copyright © Livesense Inc. • 株式会社リブセンスでSRE的なしごとしてます
◦ 2023/2 〜 ◦ 採⽤広報(ブログ運営etc..)もしてる • 趣味:公営競技の鑑賞、ホームは平塚競輪 • 略歴 ◦ ⼤学無内定卒業→フリーター ▪ 占い師とか出版社で校正とか⾊々 ◦ ⾦融SE ◦ 夜勤オペレータ ◦ SIer ◦ コンサルでSE ◦ リブセンス
1 2 3 4 誰もやりたがらない仕事、トイル 事例1:脆弱性対応の⾃動化 事例2:放置された理想の認証システム トイル解消がもたらす組織への影響 Copyright ©
Livesense Inc.
誰もやりたがらない仕事、トイル SECTION 1 Copyright © Livesense Inc.
1. 誰もやりたがらない仕事、トイル そもそも信頼性ってなんだろ? JISによると、 >アイテムが与えられた条件で規定の期間中、要求された機能を果たすこができる性 質、及び、その定量的な尺度である信頼度 ざっくりいうとちゃんと動いていることですね 信頼性向上ってなんや Copyright © Livesense
Inc.
1. 誰もやりたがらない仕事、トイル • これを担保するには、SRE本によると… ◦ 監視/計測して定量的に数字で判断、SLA/SLO/SLIなどなど ◦ こういうかっこいいやつ、正直できてませんw • 計測の前段…
◦ 計測前の深いところに信頼性を向上させるヒントがある気がした ◦ それを邪魔するのにトイルがあるんじゃないかと思った 信頼性向上ってなんや Copyright © Livesense Inc.
1. 誰もやりたがらない仕事、トイル • トイルってなに?🧐 ◦ >トイルとは、プロダクションサービスを動作させることに関係する…(略) ◦ ここでは誰もやりたがらない仕事と定義します ◦ 会議中に発⾒して共有するとネットリとした雰囲気が漂うアレです
• 作業そのものが⻑期的な価値を⽣み出さないししんどい⼿作業が多い印象です トイルってなんや Copyright © Livesense Inc.
1. 誰もやりたがらない仕事、トイル • SRE本によると… ◦ これをなくすと本来の作業に集中できて信頼性があがる😤 ◦ でも理想論じゃねこれ • 誰もやらないので窓サッシのホコリみたいに溜まりがち
◦ 誰も球を持たないので落ちたボールとか⾔われてる ◦ これをあえてやります トイルってなんや Copyright © Livesense Inc.
事例1:脆弱性対応の⾃動化 SECTION 2 Copyright © Livesense Inc.
Before:週次で⼿動アサインしていた 2.脆弱性対応の自動化 Copyright © Livesense Inc. • ⽇次でissueが切られる ◦ InspectorのAPIを利⽤
• 週次MTGでランダムアサイン • 対応 ◦ 各⾃調べてssh🤮 ◦ コマンド実⾏🤮
2.脆弱性対応の自動化 このように脆弱性対応はめんどくさい しかも積極的にやってもバリュー出ない でもやらないと正直やばい (※) 遅効性の毒みたいな存在&トイルだこれ… ※脆弱性を放置するとシステムに障害が起き、サイト信頼性が低下するかも… Copyright © Livesense
Inc.
After:まずは情報を多くした 2.脆弱性対応の自動化 Copyright © Livesense Inc. • CODEOWNERSからランダムアサイン • これだけでもMTGの時間が短くなった
2.脆弱性対応の自動化 InspectorのAPIから推奨コマンドが取れる でも⾃動アプデは依存性が怖い😱 半⾃動化にもワンステップ欲しい Copyright © Livesense Inc.
After:コメントするとSSM Run Commandで実⾏するように 2.脆弱性対応の自動化 Copyright © Livesense Inc. • /executeって書くと実⾏
◦ 結果もコメントでペタ • 5分かかる作業が1分で終了 ◦ チケットが多い⽉はうれしい ▪ 30くらいある時もある • 誰がやったかわかるから監査もOK
2.脆弱性対応の自動化 MTG短くなり他のことに時間を使える++ 複数⼈から喜びの声、これが⼀番嬉しい そして⽉2時間程度(※)の時間が地味に削減された ※4分✖30チケット 脆弱性を放置しないことで信頼性向上に繋がる Copyright © Livesense Inc.
2.脆弱性対応の自動化 なんで放置されてたのか考えてみる🤔 当時からクラウド移⾏中でした そのうちマネージドサービスに寄せるし、 いまやらなくてもいいか… という、思考 → これがよくない Copyright © Livesense Inc.
事例2:放置された理想の認証システム SECTION 3 Copyright © Livesense Inc.
乱⽴していた社内の認証を統合するプロジェクトがありました。 しかし、中途半端に実装された状態で頓挫😭 作者も退職してよくわからない状態で3年も放置されており、更に当時技 術投資で作られたのか、会社で標準的に使われてない技術なのも放置に拍 ⾞をかけていました アツい思いで作られたが頓挫、作者が退職、その後放置 3.放置された理想の認証システム Copyright © Livesense
Inc.
• というのもあり、誰もが⾒て⾒ぬフリをしていた… ◦ そこをあえて観測(み)てみると…👁 • 過剰なプロビジョニングが放置されていた! アツい思いで作られたが頓挫、作者が退職、その後放置 3.放置された理想の認証システム Copyright ©
Livesense Inc.
• 実装当初、広く使われるのを意識したのか⼤きいプロビジョニングに • 実態は1週間でDBに7コネクションしかアクセスない • 直しました、結果、⽉額4-5万円の削減に😤 ◦ EC2はm5.largeをt3.smallに ◦ RDSはdb.m5.largeをdb.t3.smallに
アツい思いで作られたが頓挫、作者が退職、その後放置 3.放置された理想の認証システム Copyright © Livesense Inc.
• なぜ触られなかったのか? ◦ 今はCIでTerraformを動かしているがCICD未整備時代のブツ ◦ オペレーションサーバーに⼊るのに多段SSHでめんどくさい アツい思いで作られたが頓挫、作者が退職、その後放置 3.放置された理想の認証システム Copyright ©
Livesense Inc.
3.放置された理想の認証システム なんで放置されてたのか考えてみる🤔 めんどうだしいまやらなくてもいいか… 結局これに尽きる めんどうはわかるがいつかはやらないとダメ この雰囲気を変えていきたいと思う Copyright © Livesense Inc.
トイル解消がもたらす組織への影響 SECTION 4 Copyright © Livesense Inc.
• トイル解消すると、今まで問題を問題と気づかなかった⼈々が気づく ◦ トイルとして認識されてない場合、ここがスタートとなる • こういうめんどい作業を新⼈がやると… ◦ コスい話、ベテラン層へのエンゲージメントになる(気がする) ◦ より強いマンパワーでトイルへ向き合うことが可能に
誰もやらないことをやると空気が変わる 4.トイル解消がもたらす組織への影響 Copyright © Livesense Inc.
• このような空気は計測不可能 ◦ 空気にSLOはない • 計測以前に作るべき⼟壌が作れる ◦ 例えば、先ほどのマンパワーを⽤いて、仕組み的にトイル解消😤な ど 誰もやらないことやると空気が変わる
4.トイル解消がもたらす組織への影響 Copyright © Livesense Inc.
• ⼊ったばっかりの時にトイル解消は実はおすすめ ◦ どこがエンジニアリングのボトルネックになっているのかわかる ▪ 改善の勘所が鍛えられる ◦ 古い資料とかコードを漁りまくるのでドメイン知識がつく • ただ…
新⼈がやるトイル解消のすすめ 4.トイル解消がもたらす組織への影響 Copyright © Livesense Inc.
• 作業として⾯⽩くない ◦ が、誰もやらない領域を攻めるので⾃分の武器ができる ◦ これをチームに展開するとさらにプラス ▪ ここでサイロ化しては元も⼦もない • バリューを出すトイル解消
◦ 盲⽬的にトイルに取り組むのではバリューは出ないが、 ◦ このように⾃動化‧改善することでバリューは出る!😤 新⼈がやるトイル解消のすすめ 4.トイル解消がもたらす組織への影響 Copyright © Livesense Inc.
• こういう姿勢で仕事してると良いことが… ◦ 表彰されました! • ⼈間としての信頼性も向上したか!? ◦ サイト信頼性も⼤事だがヒューマン信頼性もっ と⼤事な気がする 余談
4.トイル解消がもたらす組織への影響 Copyright © Livesense Inc.
4.トイル解消がもたらす組織への影響 信頼性向上、いろいろあるけど ⾃分としては⾯⽩くない仕事(=トイル)を いかに楽しくするかという基本に帰結する そしてトイル撲滅でコア業務に集中😤 これが俺の信頼性向上だ! Copyright © Livesense Inc.
最後に… ‧計測⚖ ‧監視👁 今後はこの辺りを頑張ります🙇 Copyright © Livesense Inc.
ありがとうございました Copyright © Livesense Inc.
None
None