Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
フィットする暮らしを支えるSRE 2021
Search
ryosukes
February 17, 2021
Programming
3.8k
1
Share
Embed
Copy iframe code
Copy JS code
Copy link
Start on current slide
フィットする暮らしを支えるSRE 2021
株式会社クラシコムの社内勉強会 Monthly Hygge
2021年1月29日発表時の資料
ryosukes
February 17, 2021
More Decks by ryosukes
See All by ryosukes
ALBと外部IDプロバイダーで認証しつつ、LaravelではGate・Policyを使わずシンプルに アクセス制御する方法
ryosukes
0
130
北欧、暮らしの道具店を支えるAWSマルチアカウント運用 / hokuohkurashi aws multi account
ryosukes
0
17k
EKSではなくECSを採用する理由
ryosukes
0
2.8k
RegExp Error caused by PHP upgrade 5.6 to 7.2
ryosukes
0
3.1k
Hello kubernetes
ryosukes
0
1.6k
コマンド履歴にタグを つけるCLIツールを作った
ryosukes
0
2.1k
Other Decks in Programming
See All in Programming
AIとASP.NET Coreで雑Webアプリを作った話
mayuki
0
500
Vue × Nuxt × Oxc どこまで使える?実運用の現在地
andpad
0
210
LLM本来の能力を解き放つサンドボックス技術とAI民主化への適用
yukukotani
3
3.6k
ローカルLLMを使ってB2Bサービスを作っていての学び
yaotti
0
160
jQueryをバージョンアップする前に使いたいjQuery Migrate
matsuo_atsushi
0
200
Datadog × OpenTelemetry 入門と実践のあいだ
kn_to_maxpno
1
150
These Five Tricks Can Make Your Apps Greener, Cheaper, & Nicer
hollycummins
0
280
LLMによるContent Moderationの本番運用の裏側と品質担保への挑戦
suikabar
2
560
軽量Java基盤の設計 DIコンテナに頼らない、長期保守と1秒起動の実現 JJUG CCC 2026 Spring
macha64
0
490
Inside Stream API
skrb
1
680
DynamoDBには集計系のクエリがないけどなんとかしたい
musan
1
130
代数的データ型って何が嬉しいの? #frontend_phpcon_do
kajitack
8
3.3k
Featured
See All Featured
Measuring Dark Social's Impact On Conversion and Attribution
stephenakadiri
2
220
DevOps and Value Stream Thinking: Enabling flow, efficiency and business value
helenjbeal
1
230
Optimizing for Happiness
mojombo
378
71k
Faster Mobile Websites
deanohume
310
31k
First, design no harm
axbom
PRO
2
1.2k
Collaborative Software Design: How to facilitate domain modelling decisions
baasie
1
250
Jamie Indigo - Trashchat’s Guide to Black Boxes: Technical SEO Tactics for LLMs
techseoconnect
PRO
0
160
How to train your dragon (web standard)
notwaldorf
97
6.7k
Bioeconomy Workshop: Dr. Julius Ecuru, Opportunities for a Bioeconomy in West Africa
akademiya2063
PRO
1
140
Refactoring Trust on Your Teams (GOTO; Chicago 2020)
rmw
35
3.5k
From Legacy to Launchpad: Building Startup-Ready Communities
dugsong
0
230
Responsive Adventures: Dirty Tricks From The Dark Corners of Front-End
smashingmag
254
22k
Transcript
フィットする暮らしを支えるSRE 2021 Monthly Hygge 2021-01-29 Ryosuke Sasaki(@ryosukes) 1
Profile - 出身: 宮城 - 趣味: 音楽 - 最近: 引越しました(ネット回線難民)
2
Index 1. SREって? 2. 2020年を軽く振り返る 3. 2021年の課題 4. その先は 3
4 SREって?
5
SREって? - Site Reliability Engineeringの略 - Googleで培われたシステム管理とサービス運用の方法論 - サイトの信頼性を高め、サービスの収益・ブランドを支える役割 -
定常業務、インフラ構築、障害管理、パフォーマンス管理などの自動化・ 自律化の仕組み整備をソフトウェア開発を通して行う 6
クラシコムのSREの役割は? - 安定して高速でデリバリーできる状態を継続的に作る - サービスが「ちゃんと動いているかどうか」がわかる状態にする - 変更容易性に優れたシステム環境の土台を作る - 適切なコストでパフォーマンスの良いシステム環境を作る -
夜も安心して眠れる状態を作る💤 7
イメージは - 高速道路 - アプリ/サイトの機能が車。コンテンツが載ってる - 道路、ガードレール、ETC、SA/PA、オービスなど 継続的なメンテナンス・変更・改善が不可欠 - 一度作ったら終わりではない
8
9 2020年を振り返る
2020年を振り返る① - 負荷試験・キャパシティプランニング - パフォーマンスチェックと改善 - 試験手法のラーニング - AWSのアカウントまわり見直し -
AWSのマルチアカウント化 - 本番とその他用途の環境の分離による事故防止 - セキュリティの向上 - IAMユーザー・ロールなど権限管理の効率化 10
2020年を振り返る② - Infrastructure as Code(Terraform, ecspressoなど) - バージョン管理 - ブラックボックス解消
- レビューしやすく品質も向上 - コンテナ技術(ECS/Docker)への移行 - 状態を持たないため安定稼働する - 他エンジニアへの権限移譲 - 開発のしやすさ、開発速度の向上 11
2020年を振り返る③ - モニタリングツール活用(Mackerel, Datadog...etc) - 問題の早期発見 - 障害対応の迅速化 - ログ管理の整備(Logentries
→ CWL移行) - 調査スピードの改善 - ログの種類を増やしやすくした - DBをRDSからAuroraへ - パフォーマンス改善(最大MySQLの5倍の処理速度) - データ消失リスクの軽減 - 高速フェイルオーバー 12
13 2021年の課題
2021年の課題 1. DevSecOps的な何か 2. 検証環境作成の簡易化・自動化 3. インフラコストの管理・最適化 14
検証環境作成の簡易化・自動化 - 開発途中のものを他の人に見せたりチェックするとき、どこかのサーバー にあげないといけない - 現状、検証環境を扱えるエンジニアは権限・時間的制約などがあり限られ ている - 今後エンジニアの人数、並行して動く施策が増えていく可能性を考える と、整備しておく必要がある
15
解決するには - ブランチ単位で環境を作成できるような新たな仕組み等を作る - 個人が環境を持っていて簡単に反映できる、というのでもまずは良いとは 思う 16
インフラコストの管理・最適化 - サービスが成長する毎にスケールアウト、アップするサーバー達や増えて いく各種サービス達(AWS・GCP・他SaaS) - コストが適切かどうか把握・改善できる体制は中長期的に整備しておきた い 17
解決するには - クォーターごとの予算立て、振り返り - AWSのアカウント単位でバジェットの設定見直し - 小さめな工数でやれそうなことをまずやる - Savings Plan
- 不要なリソースのチェック - 不要なときに落とせるものは落とす(Aurora serverlessとか) など 18
他やりたいこと - IaC(Terraform化)を進める - 踏み台サーバーの改善 - CI/CDの改善 など 19
20 その先は
その先は - SLO・エラーバジェットの設定と運用 - SREの民主化、SREの解体 - 佐々木、アプリケーション開発に復帰?🙌 21
22 ありがとうございました