Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
クラウド移行を通じた SRE/DevOps の実践 / SRE and DevOps Pra...
Search
mom0tomo
August 28, 2023
Programming
1
580
クラウド移行を通じた SRE/DevOps の実践 / SRE and DevOps Practice in Cloud Migration
ゆるSRE勉強会第一回発表資料です。マッハバイトのクラウド移行を通じた、SRE/DevOpsを実践する取り組みについて具体的に話します。
mom0tomo
August 28, 2023
Tweet
Share
More Decks by mom0tomo
See All by mom0tomo
「名前のない仕事」にチームで取り組む–WOLとトラッキングツールの活用- / The SRE team's approach to unnamed work
mom0tomo
3
620
golang tokyo go tools
mom0tomo
3
1.3k
最初の言語としてGoを学んだ人から見た Ruby on Rails
mom0tomo
2
620
はじめてみんなで作ったGoのツールの話
mom0tomo
0
150
人材業界 中の人が語る 若手エンジニアの転職活動
mom0tomo
0
520
Go-ビギナーズ - よくある3つの質問
mom0tomo
2
130
Go徒然日記
mom0tomo
0
1.4k
LTLovers meetup 1st - the core of "your" love -
mom0tomo
1
750
Other Decks in Programming
See All in Programming
CloudNativePGを布教したい
nnaka2992
0
120
CSS Linter による Baseline サポートの仕組み
ryo_manba
1
160
「個人開発マネタイズ大全」が教えてくれたこと
bani24884
1
290
自力でTTSモデルを作った話
zgock999
0
120
『テスト書いた方が開発が早いじゃん』を解き明かす #phpcon_nagoya
o0h
PRO
9
2.5k
コードを読んで理解するko build
bells17
1
110
Better Code Design in PHP
afilina
0
180
Amazon Bedrockマルチエージェントコラボレーションを諦めてLangGraphに入門してみた
akihisaikeda
1
150
Honoをフロントエンドで使う 3つのやり方
yusukebe
7
3.6k
From the Wild into the Clouds - Laravel Meetup Talk
neverything
0
180
⚪⚪の⚪⚪をSwiftUIで再現す る
u503
0
100
苦しいTiDBへの移行を乗り越えて快適な運用を目指す
leveragestech
0
1.2k
Featured
See All Featured
Visualization
eitanlees
146
15k
BBQ
matthewcrist
87
9.5k
I Don’t Have Time: Getting Over the Fear to Launch Your Podcast
jcasabona
32
2.2k
Navigating Team Friction
lara
183
15k
The Psychology of Web Performance [Beyond Tellerrand 2023]
tammyeverts
46
2.4k
YesSQL, Process and Tooling at Scale
rocio
172
14k
Optimising Largest Contentful Paint
csswizardry
34
3.1k
Easily Structure & Communicate Ideas using Wireframe
afnizarnur
193
16k
Six Lessons from altMBA
skipperchong
27
3.6k
Design and Strategy: How to Deal with People Who Don’t "Get" Design
morganepeng
129
19k
Art, The Web, and Tiny UX
lynnandtonic
298
20k
Helping Users Find Their Own Way: Creating Modern Search Experiences
danielanewman
29
2.5k
Transcript
クラウド移行を通じた SRE/DevOps の実践
バックエンドエンジニア → インフラエンジニア、 SREs 現在はマッハバイト インフラ担当。 趣味: 限界まで安い手段で海外旅行に行くこと mom0tomo 渡辺もも
テクノロジカルマーケティング部 インフラストラクチャーグループ Copyright © Livesense Inc.
About Livesense Invent The Next Common. Copyright © Livesense Inc.
Livesenseの事業 Copyright © Livesense Inc.
Copyright © Livesense Inc. • 社員数 ◦ 正社員 214名(2023年6月30日現在) •
エンジニア社員数 ◦ 全体 63名 正社員 40名 ◦ 正社員だけで見るとエンジニア職が1/5を 占める 社員数・組織規模
インフラグループ Copyright © Livesense Inc. • 事業部に属さない全社横断組織 • 6人+兼務2人 •
各事業部に対し、1-2人が窓口担当になる (DevOps/SRE的な動きもする) • リブセンス全体で利用する基盤・プラット フォームも管轄する
本日話すこと 1 クラウド移行の背景 2 移行前の課題 3 移行で改善できたこと 4 今後の課題 Copyright
© Livesense Inc.
クラウド移行の背景 Copyright © Livesense Inc.
クラウド移行の背景 フルリモートワーク化からのオフィス移転 • 創業期から契約しているデータセンターがある ◦ 創業当時からのサービスであるマッハバイト(旧ジョブセンス)では、ほとんどのシステムがオンプ レで運用されてきた • 新しい事業はクラウドで運用されているものも多い ◦
knew(マッチングサービス)、 batonn(面接最適化サービス)、 IESHIL(不動産事業)などは最初か らクラウド上で運用されている ◦ 転職会議・転職ドラフトもほぼオンプレから AWSに移行済み • コロナ禍で全社フルリモートワーク化し、オフィスを WeWorkに移転した ◦ オフィス内のサーバールームで運用してきた開発環境を急遽クラウドに移行した ◦ これを契機にクラウド移行の機運が加速した • 2023年末をもってクラウド移行が完了する予定 Copyright © Livesense Inc.
クラウド移行の背景 Copyright © Livesense Inc. https://made.livesense.co.jp/entry/2022/12/21/083000
移行前の課題 Copyright © Livesense Inc.
• 開発(アプリケーションエンジニア)と運用(インフラエンジニア)の間に壁があった • 権限の壁 ◦ オンプレミスのサーバーの設定変更はインフラチームに作業依頼が必要 ▪ sudo権限がないとインフラの設定変更ができない ▪ VM構築(サーバー準備)はインフラの担当
etc.. ◦ アプリケーション側の変更はアプリケーション開発チームに作業依頼が必要 ▪ リポジトリがたくさんあってデプロイ方法も統一されておらず複雑 ▪ 一部システムは監査対応のための特別な承認フローがある etc… • コミュニケーションの壁 ◦ プロジェクト・チームごとに Slackチャンネルが分かれていて気軽に声をかけづらい ◦ 隔週の定例が正式なコミュニケーションの場だが、シャンシャンと終わりがち 移行前の課題 「開発」と「運用」の分断 Copyright © Livesense Inc.
• サービスの信頼性への責任が曖昧になる ◦ 共用インフラ基盤の調査はインフラエンジニアが担当する ▪ 開発エンジニアが直接 L7LBのログを見られない etc. ◦ 監視・モニタリングサービスの導入はインフラチームが担当する
▪ 何かアラートがなったとき、設定した人(インフラチーム)が対応しがち • 作業待ちが発生してデリバリーに時間がかかる ◦ 「インフラチームがVM構築終わったらデプロイができる」(開発エンジニアは自分でサーバー構築 できない)etc. • アプリケーションの本質的な改善が進まない ◦ アプリケーションのコードを直せば解決する問題でも、リソースを増やすなどインフラ側でなんとか してしまい、保守性が下がる 移行前の課題 分断による悪影響 Copyright © Livesense Inc.
移行で改善できたこと Copyright © Livesense Inc.
• 権限を見直す ◦ インフラエンジニアしかサーバの rootを取れない→AWSのIAMグループを利用して適切な権限を 付与する • コミュニケーションチャネルを見直す ◦ Slackチャンネルを整理、統合してコミュニケーションの活性化を図る
◦ Work Out Loudの文化を伝える ▪ インフラチームEMの方がマッハバイトの EMを兼務してくれたことでスムーズに導入された • 信頼性向上に取り組むための土台を作る ◦ 共同で勉強会を開催してインフラ・モニタリングに関する知識を伝達する ▪ AWS勉強会、Datadog勉強会 移行で改善できたこと SRE/DevOpsの実践 Copyright © Livesense Inc.
• 複雑なリリースフローを改善する ◦ GitHub Actionsを利用してPRベースのデプロイワークフローを組む ◦ GitHubのリリース機能を利用し、リリースフローを省略する • IaCを徹底する ◦
インフラ構成のコードをリポジトリにまとめ、開発エンジニアも contributeできるようにする ▪ 開発エンジニアもレビューを受けて自由にインフラの構成変更ができる • モブプロでクラウド移行を加速する ◦ 協働してCI/CDワークフローを整備する ◦ 移行で邪魔になるデッドコードの削除、アーキテクチャの変更などその場で話し合って素早い意思 決定を行う 移行で改善できたこと SRE/DevOpsの実践 Copyright © Livesense Inc.
→ “越境文化”はSREっぽい! https://recruit.livesense.co.jp/lp/engineer/overview Copyright © Livesense Inc.
今後の課題 Copyright © Livesense Inc.
今後の課題 これからやりたいこと • サービスレベル(SLI/SLO)の策定と実践 ◦ 足元の整備中 ▪ Datadogを活用する ▪ エラーバジェットを定義する
• 誰でも障害対応できる体制づくり ◦ メトリクス・モニター・ダッシュボードのノウハウを共有する ◦ 障害対応を振り返り、ベテランの動きを学ぶ ◦ 詳しくないシステムで障害が起こったときに「シャドー」になる Copyright © Livesense Inc.
Copyright © Livesense Inc. • エンジニアブログ ◦ https://made.livesense.co.jp/ • Livesense
Engineering Handbook ◦ https://livesense-inc.gitbook.io/livesense-e ngineering-handbook/ エンジニアによる発信の ご紹介
クラウド移行の取り組みも発信中 https://made.livesense.co.jp/entry/2023/06/27/080000 https://made.livesense.co.jp/entry/2023/06/14/080000 https://made.livesense.co.jp/entry/2023/08/25/083000 Copyright © Livesense Inc.
None