Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
フィットする暮らしを支えるSRE 2021
Search
ryosukes
February 17, 2021
Programming
1
3.6k
フィットする暮らしを支えるSRE 2021
株式会社クラシコムの社内勉強会 Monthly Hygge
2021年1月29日発表時の資料
ryosukes
February 17, 2021
Tweet
Share
More Decks by ryosukes
See All by ryosukes
ALBと外部IDプロバイダーで認証しつつ、LaravelではGate・Policyを使わずシンプルに アクセス制御する方法
ryosukes
0
88
北欧、暮らしの道具店を支えるAWSマルチアカウント運用 / hokuohkurashi aws multi account
ryosukes
0
16k
EKSではなくECSを採用する理由
ryosukes
0
2.7k
RegExp Error caused by PHP upgrade 5.6 to 7.2
ryosukes
0
3k
Hello kubernetes
ryosukes
0
1.6k
コマンド履歴にタグを つけるCLIツールを作った
ryosukes
0
2.1k
Other Decks in Programming
See All in Programming
DataformでPythonする / dataform-de-python
snhryt
0
180
AIに安心して任せるためにTypeScriptで一意な型を作ろう
arfes0e2b3c
0
370
サイトを作ったらNFCタグキーホルダーを爆速で作れ!
yuukis
0
350
DynamoDBは怖くない!〜テーブル設計の勘所とテスト戦略〜
hyamazaki
1
200
実践 Dev Containers × Claude Code
touyu
1
210
STUNMESH-go: Wireguard NAT穿隧工具的源起與介紹
tjjh89017
0
380
decksh - a little language for decks
ajstarks
4
21k
バイブコーディング × 設計思考
nogu66
0
120
What's new in Adaptive Android development
fornewid
0
140
Understanding Kotlin Multiplatform
l2hyunwoo
0
260
Dart 参戦!!静的型付き言語界の隠れた実力者
kno3a87
0
200
あのころの iPod を どうにか再生させたい
orumin
2
2.5k
Featured
See All Featured
Why Our Code Smells
bkeepers
PRO
338
57k
A better future with KSS
kneath
239
17k
A designer walks into a library…
pauljervisheath
207
24k
RailsConf 2023
tenderlove
30
1.2k
GraphQLの誤解/rethinking-graphql
sonatard
71
11k
4 Signs Your Business is Dying
shpigford
184
22k
Reflections from 52 weeks, 52 projects
jeffersonlam
351
21k
Faster Mobile Websites
deanohume
309
31k
YesSQL, Process and Tooling at Scale
rocio
173
14k
Performance Is Good for Brains [We Love Speed 2024]
tammyeverts
10
1k
Easily Structure & Communicate Ideas using Wireframe
afnizarnur
194
16k
Making the Leap to Tech Lead
cromwellryan
134
9.5k
Transcript
フィットする暮らしを支えるSRE 2021 Monthly Hygge 2021-01-29 Ryosuke Sasaki(@ryosukes) 1
Profile - 出身: 宮城 - 趣味: 音楽 - 最近: 引越しました(ネット回線難民)
2
Index 1. SREって? 2. 2020年を軽く振り返る 3. 2021年の課題 4. その先は 3
4 SREって?
5
SREって? - Site Reliability Engineeringの略 - Googleで培われたシステム管理とサービス運用の方法論 - サイトの信頼性を高め、サービスの収益・ブランドを支える役割 -
定常業務、インフラ構築、障害管理、パフォーマンス管理などの自動化・ 自律化の仕組み整備をソフトウェア開発を通して行う 6
クラシコムのSREの役割は? - 安定して高速でデリバリーできる状態を継続的に作る - サービスが「ちゃんと動いているかどうか」がわかる状態にする - 変更容易性に優れたシステム環境の土台を作る - 適切なコストでパフォーマンスの良いシステム環境を作る -
夜も安心して眠れる状態を作る💤 7
イメージは - 高速道路 - アプリ/サイトの機能が車。コンテンツが載ってる - 道路、ガードレール、ETC、SA/PA、オービスなど 継続的なメンテナンス・変更・改善が不可欠 - 一度作ったら終わりではない
8
9 2020年を振り返る
2020年を振り返る① - 負荷試験・キャパシティプランニング - パフォーマンスチェックと改善 - 試験手法のラーニング - AWSのアカウントまわり見直し -
AWSのマルチアカウント化 - 本番とその他用途の環境の分離による事故防止 - セキュリティの向上 - IAMユーザー・ロールなど権限管理の効率化 10
2020年を振り返る② - Infrastructure as Code(Terraform, ecspressoなど) - バージョン管理 - ブラックボックス解消
- レビューしやすく品質も向上 - コンテナ技術(ECS/Docker)への移行 - 状態を持たないため安定稼働する - 他エンジニアへの権限移譲 - 開発のしやすさ、開発速度の向上 11
2020年を振り返る③ - モニタリングツール活用(Mackerel, Datadog...etc) - 問題の早期発見 - 障害対応の迅速化 - ログ管理の整備(Logentries
→ CWL移行) - 調査スピードの改善 - ログの種類を増やしやすくした - DBをRDSからAuroraへ - パフォーマンス改善(最大MySQLの5倍の処理速度) - データ消失リスクの軽減 - 高速フェイルオーバー 12
13 2021年の課題
2021年の課題 1. DevSecOps的な何か 2. 検証環境作成の簡易化・自動化 3. インフラコストの管理・最適化 14
検証環境作成の簡易化・自動化 - 開発途中のものを他の人に見せたりチェックするとき、どこかのサーバー にあげないといけない - 現状、検証環境を扱えるエンジニアは権限・時間的制約などがあり限られ ている - 今後エンジニアの人数、並行して動く施策が増えていく可能性を考える と、整備しておく必要がある
15
解決するには - ブランチ単位で環境を作成できるような新たな仕組み等を作る - 個人が環境を持っていて簡単に反映できる、というのでもまずは良いとは 思う 16
インフラコストの管理・最適化 - サービスが成長する毎にスケールアウト、アップするサーバー達や増えて いく各種サービス達(AWS・GCP・他SaaS) - コストが適切かどうか把握・改善できる体制は中長期的に整備しておきた い 17
解決するには - クォーターごとの予算立て、振り返り - AWSのアカウント単位でバジェットの設定見直し - 小さめな工数でやれそうなことをまずやる - Savings Plan
- 不要なリソースのチェック - 不要なときに落とせるものは落とす(Aurora serverlessとか) など 18
他やりたいこと - IaC(Terraform化)を進める - 踏み台サーバーの改善 - CI/CDの改善 など 19
20 その先は
その先は - SLO・エラーバジェットの設定と運用 - SREの民主化、SREの解体 - 佐々木、アプリケーション開発に復帰?🙌 21
22 ありがとうございました