Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
「SRE初心者からの挑戦! 半年でやってきたことと今後の展望」
Search
haruki
April 14, 2023
Technology
0
1.6k
「SRE初心者からの挑戦! 半年でやってきたことと今後の展望」
haruki
April 14, 2023
Tweet
Share
More Decks by haruki
See All by haruki
メールサービスの信頼性を支えるSREの取り組み
harukin721
2
2.3k
Other Decks in Technology
See All in Technology
下手な強制、ダメ!絶対! 「ガードレール」を「檻」にさせない"ガバナンス"の取り方とは?
tsukaman
2
460
フルカイテン株式会社 エンジニア向け採用資料
fullkaiten
0
8.8k
MagicPod導入から半年、オープンロジQAチームで実際にやったこと
tjoko
0
110
Unlocking the Power of AI Agents with LINE Bot MCP Server
linedevth
0
110
企業の生成AIガバナンスにおけるエージェントとセキュリティ
lycorptech_jp
PRO
2
190
[ JAWS-UG 東京 CommunityBuilders Night #2 ]SlackとAmazon Q Developerで 運用効率化を模索する
sh_fk2
3
460
AI時代を生き抜くエンジニアキャリアの築き方 (AI-Native 時代、エンジニアという道は 「最大の挑戦の場」となる) / Building an Engineering Career to Thrive in the Age of AI (In the AI-Native Era, the Path of Engineering Becomes the Ultimate Arena of Challenge)
jeongjaesoon
0
240
開発者を支える Internal Developer Portal のイマとコレカラ / To-day and To-morrow of Internal Developer Portals: Supporting Developers
aoto
PRO
1
480
人工衛星のファームウェアをRustで書く理由
koba789
15
8.2k
Generative AI Japan 第一回生成AI実践研究会「AI駆動開発の現在地──ブレイクスルーの鍵を握るのはデータ領域」
shisyu_gaku
0
330
Aurora DSQLはサーバーレスアーキテクチャの常識を変えるのか
iwatatomoya
1
1.2k
Create Ruby native extension gem with Go
sue445
0
120
Featured
See All Featured
Context Engineering - Making Every Token Count
addyosmani
3
58
Site-Speed That Sticks
csswizardry
10
820
Dealing with People You Can't Stand - Big Design 2015
cassininazir
367
27k
Design and Strategy: How to Deal with People Who Don’t "Get" Design
morganepeng
131
19k
No one is an island. Learnings from fostering a developers community.
thoeni
21
3.4k
Statistics for Hackers
jakevdp
799
220k
Fireside Chat
paigeccino
39
3.6k
Done Done
chrislema
185
16k
Refactoring Trust on Your Teams (GOTO; Chicago 2020)
rmw
35
3.1k
Bash Introduction
62gerente
615
210k
ピンチをチャンスに:未来をつくるプロダクトロードマップ #pmconf2020
aki_iinuma
127
53k
The Illustrated Children's Guide to Kubernetes
chrisshort
48
50k
Transcript
1 「SRE初心者からの挑戦! 半年でやってきたことと今後の展望」 上島 春輝 / GMO PEPABO inc. 2023.04.14
Pepabo Tech Conference #20 春のSREまつり
2 アジェンダ 1. 自己紹介 2. これまでの経歴 3. GMOペパボへ入社 4. 半年でやってきたこと
5. 今後やっていきたいこと 6. まとめ
3 1. 自己紹介
GMOペパボ 技術部 プラットフォームグループ 2022年9月 中途入社 4 自己紹介 上島 春輝 Uejima Haruki •
初登壇です!!! • 社内では harukin と呼ばれている • 主にカラーミーショップの運用に携わっている • 自宅に Kubernetesクラスタを飼いたいです Twitter : @harukin721
5 2. これまでの経歴
これまでの経歴 6 新卒(SES) • Linux や AWS の実務経験はなし (Javaを少し..) •
LPIC-1, AWS CLF,SAA,DVA,SOA 2社目(スタートアップ) • 新規社内システムのインフラをAWSで構築 • 初めて Linux や AWS を実務で触った 3社目(GMOペパボ) • システムの運用経験なしで入社
7 3. GMOペパボへ入社
8 “ 分からないことが多すぎる...” GMOペパボへ入社
使っている技術スタックの幅が広くて、分からないことだらけだった。 新卒の頃にインフラに興味を持ってから、自分なりに勉強してきたつもりだったけど、 学んだことを実務でどのように活用していくとよいかあまり分かっていなかった。 9 コンテナ技術 分からない Linux 分からない システムの障害対応 分からない
9 GMOペパボへ入社
10 システムの障害対応、Linux、Kubernetes 分からない • システム障害の発生時にどうやって対応すると良いか分からない ◦ ログやモニタリングの確認方法が分からない • Linux を実務であまり触ってこなかった
◦ 基本的なコマンドは分かっていたけど... ◦ Nginx や メールのログの場所が分からない • コンテナ技術、特に Kubernetes がよく分からない ◦ Kubernetes を構成するコンポーネントの役割が分かっていない ◦ Prometheus, Grafana, Datadog... GMOペパボへ入社
11 4. 半年でやってきたこと
12 システムの障害対応が分からないなかでやってきたこと • システム障害の発生時は、何が問題になっていて、何を解決すると良いか考える • Slack や GHES の Issue
から類似していそうなものを探してくる ◦ 実際に一連の調査・対応を同じようにコマンドを実行してみる ◦ 得られた結果からどういったことが分かるのかを理解する ◦ 最後に自分なりに内容を整理してまとめる 半年でやってきたこと
13 Linux が分からないなかでやってきたこと • Linux を体系的に学ぶために LPIC-2 を取った ◦ Nginx,
DNS, SSL証明書やメール等の知識が身についた ◦ 全然分からない、聞いたことがないから脱却することができた ◦ チームでの会話の内容が以前よりも理解できるようになった ◦ 全く分からないが減ったのでスプリントタスクでも役立った 半年でやってきたこと
14 コンテナ技術が分からないなかでやってきたこと • 実際に手を動かして Kubernetes クラスタの再作成をした ◦ Kubernetes のコンポーネントをひとつひとつ理解しながら進める ◦
チームの方にサポートをしてもらいながら、不明点は解消して進める ◦ 逐次 GHES の gist にやったことを記録しながら進めてやりきった 半年でやってきたこと
15 “ 少しずつ分かることが増えた ” 半年でやってきたこと
16 やったこと • OpenStack と AWS 上に Terraform でサーバ構築 •
Puppet でサーバの構成管理 • Mackerel による監視設定の追加・変更 • メール(DNSBL, IPレピュテーション...etc)の対応 • メールサーバの移設 • SLO 違反に繋がりそうな原因の調査 • SSL証明書の更新作業 • Kubernetes クラスタの再作成 ...etc 半年でやってきたこと
17 5. 今後やっていきたいこと
18 もっともっと運用スキルを身につけていきたい • サービスの基盤となっているプライベートクラウド(OpenStack)と パブリッククラウド(AWS)のインフラ構築・運用スキルを身につける • インフラのコスト最適化にも取り組んでいく • サービスの信頼性向上に必要なことはすべてチャレンジしていきたい!!! 今後やっていきたいこと
19 6. まとめ
まとめ 20 • 入社前からやりたかったインフラの仕事ができている • VM や クラウド、幅広い技術を触ることができていて、 半年で分かることがとても増えた •
チームに活気があり、優秀なエンジニアの方と一緒に ワイワイ楽しく仕事ができている • これからも自分のできることを増やしていきつつ、 チームのみんなと一緒により良いサービスを提供して いきます!!! GMOペパボのSREになってみて
ご静聴ありがとうございました!!! 21