Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
「SRE初心者からの挑戦! 半年でやってきたことと今後の展望」
Search
haruki
April 14, 2023
Technology
0
1.5k
「SRE初心者からの挑戦! 半年でやってきたことと今後の展望」
haruki
April 14, 2023
Tweet
Share
More Decks by haruki
See All by haruki
メールサービスの信頼性を支えるSREの取り組み
harukin721
2
2.1k
Other Decks in Technology
See All in Technology
利用終了したドメイン名の最強終活〜観測環境を育てて、分析・供養している件〜 / The Ultimate End-of-Life Preparation for Discontinued Domain Names
nttcom
2
200
リーダブルテストコード 〜メンテナンスしやすい テストコードを作成する方法を考える〜 #DevSumi #DevSumiB / Readable test code
nihonbuson
11
7.3k
The Future of SEO: The Impact of AI on Search
badams
0
200
転生CISOサバイバル・ガイド / CISO Career Transition Survival Guide
kanny
3
1k
あれは良かった、あれは苦労したB2B2C型SaaSの新規開発におけるCloud Spanner
hirohito1108
2
610
全文検索+セマンティックランカー+LLMの自然文検索サ−ビスで得られた知見
segavvy
2
110
Larkご案内資料
customercloud
PRO
0
650
エンジニアの育成を支える爆速フィードバック文化
sansantech
PRO
3
1.1k
なぜ私は自分が使わないサービスを作るのか? / Why would I create a service that I would not use?
aiandrox
0
750
プロダクトエンジニア構想を立ち上げ、プロダクト志向な組織への成長を続けている話 / grow into a product-oriented organization
hiro_torii
1
210
ハッキングの世界に迫る~攻撃者の思考で考えるセキュリティ~
nomizone
13
5.2k
(機械学習システムでも) SLO から始める信頼性構築 - ゆる SRE#9 2025/02/21
daigo0927
0
130
Featured
See All Featured
Practical Tips for Bootstrapping Information Extraction Pipelines
honnibal
PRO
12
960
"I'm Feeling Lucky" - Building Great Search Experiences for Today's Users (#IAC19)
danielanewman
226
22k
Fireside Chat
paigeccino
34
3.2k
The Illustrated Children's Guide to Kubernetes
chrisshort
48
49k
JavaScript: Past, Present, and Future - NDC Porto 2020
reverentgeek
47
5.2k
The Cost Of JavaScript in 2023
addyosmani
47
7.3k
The Language of Interfaces
destraynor
156
24k
Keith and Marios Guide to Fast Websites
keithpitt
411
22k
Making the Leap to Tech Lead
cromwellryan
133
9.1k
Stop Working from a Prison Cell
hatefulcrawdad
267
20k
Optimising Largest Contentful Paint
csswizardry
34
3.1k
Reflections from 52 weeks, 52 projects
jeffersonlam
348
20k
Transcript
1 「SRE初心者からの挑戦! 半年でやってきたことと今後の展望」 上島 春輝 / GMO PEPABO inc. 2023.04.14
Pepabo Tech Conference #20 春のSREまつり
2 アジェンダ 1. 自己紹介 2. これまでの経歴 3. GMOペパボへ入社 4. 半年でやってきたこと
5. 今後やっていきたいこと 6. まとめ
3 1. 自己紹介
GMOペパボ 技術部 プラットフォームグループ 2022年9月 中途入社 4 自己紹介 上島 春輝 Uejima Haruki •
初登壇です!!! • 社内では harukin と呼ばれている • 主にカラーミーショップの運用に携わっている • 自宅に Kubernetesクラスタを飼いたいです Twitter : @harukin721
5 2. これまでの経歴
これまでの経歴 6 新卒(SES) • Linux や AWS の実務経験はなし (Javaを少し..) •
LPIC-1, AWS CLF,SAA,DVA,SOA 2社目(スタートアップ) • 新規社内システムのインフラをAWSで構築 • 初めて Linux や AWS を実務で触った 3社目(GMOペパボ) • システムの運用経験なしで入社
7 3. GMOペパボへ入社
8 “ 分からないことが多すぎる...” GMOペパボへ入社
使っている技術スタックの幅が広くて、分からないことだらけだった。 新卒の頃にインフラに興味を持ってから、自分なりに勉強してきたつもりだったけど、 学んだことを実務でどのように活用していくとよいかあまり分かっていなかった。 9 コンテナ技術 分からない Linux 分からない システムの障害対応 分からない
9 GMOペパボへ入社
10 システムの障害対応、Linux、Kubernetes 分からない • システム障害の発生時にどうやって対応すると良いか分からない ◦ ログやモニタリングの確認方法が分からない • Linux を実務であまり触ってこなかった
◦ 基本的なコマンドは分かっていたけど... ◦ Nginx や メールのログの場所が分からない • コンテナ技術、特に Kubernetes がよく分からない ◦ Kubernetes を構成するコンポーネントの役割が分かっていない ◦ Prometheus, Grafana, Datadog... GMOペパボへ入社
11 4. 半年でやってきたこと
12 システムの障害対応が分からないなかでやってきたこと • システム障害の発生時は、何が問題になっていて、何を解決すると良いか考える • Slack や GHES の Issue
から類似していそうなものを探してくる ◦ 実際に一連の調査・対応を同じようにコマンドを実行してみる ◦ 得られた結果からどういったことが分かるのかを理解する ◦ 最後に自分なりに内容を整理してまとめる 半年でやってきたこと
13 Linux が分からないなかでやってきたこと • Linux を体系的に学ぶために LPIC-2 を取った ◦ Nginx,
DNS, SSL証明書やメール等の知識が身についた ◦ 全然分からない、聞いたことがないから脱却することができた ◦ チームでの会話の内容が以前よりも理解できるようになった ◦ 全く分からないが減ったのでスプリントタスクでも役立った 半年でやってきたこと
14 コンテナ技術が分からないなかでやってきたこと • 実際に手を動かして Kubernetes クラスタの再作成をした ◦ Kubernetes のコンポーネントをひとつひとつ理解しながら進める ◦
チームの方にサポートをしてもらいながら、不明点は解消して進める ◦ 逐次 GHES の gist にやったことを記録しながら進めてやりきった 半年でやってきたこと
15 “ 少しずつ分かることが増えた ” 半年でやってきたこと
16 やったこと • OpenStack と AWS 上に Terraform でサーバ構築 •
Puppet でサーバの構成管理 • Mackerel による監視設定の追加・変更 • メール(DNSBL, IPレピュテーション...etc)の対応 • メールサーバの移設 • SLO 違反に繋がりそうな原因の調査 • SSL証明書の更新作業 • Kubernetes クラスタの再作成 ...etc 半年でやってきたこと
17 5. 今後やっていきたいこと
18 もっともっと運用スキルを身につけていきたい • サービスの基盤となっているプライベートクラウド(OpenStack)と パブリッククラウド(AWS)のインフラ構築・運用スキルを身につける • インフラのコスト最適化にも取り組んでいく • サービスの信頼性向上に必要なことはすべてチャレンジしていきたい!!! 今後やっていきたいこと
19 6. まとめ
まとめ 20 • 入社前からやりたかったインフラの仕事ができている • VM や クラウド、幅広い技術を触ることができていて、 半年で分かることがとても増えた •
チームに活気があり、優秀なエンジニアの方と一緒に ワイワイ楽しく仕事ができている • これからも自分のできることを増やしていきつつ、 チームのみんなと一緒により良いサービスを提供して いきます!!! GMOペパボのSREになってみて
ご静聴ありがとうございました!!! 21