Slide 1

Slide 1 text

1 「SRE初心者からの挑戦! 半年でやってきたことと今後の展望」 上島 春輝 / GMO PEPABO inc. 2023.04.14 Pepabo Tech Conference #20 春のSREまつり

Slide 2

Slide 2 text

2 アジェンダ 1. 自己紹介 2. これまでの経歴 3. GMOペパボへ入社 4. 半年でやってきたこと 5. 今後やっていきたいこと 6. まとめ

Slide 3

Slide 3 text

3 1. 自己紹介

Slide 4

Slide 4 text

GMOペパボ 技術部 プラットフォームグループ  2022年9月 中途入社 4 自己紹介 上島 春輝 Uejima Haruki ● 初登壇です!!! ● 社内では harukin と呼ばれている ● 主にカラーミーショップの運用に携わっている ● 自宅に Kubernetesクラスタを飼いたいです Twitter : @harukin721

Slide 5

Slide 5 text

5 2. これまでの経歴

Slide 6

Slide 6 text

これまでの経歴 6 新卒(SES) ● Linux や AWS の実務経験はなし (Javaを少し..) ● LPIC-1, AWS CLF,SAA,DVA,SOA 2社目(スタートアップ) ● 新規社内システムのインフラをAWSで構築 ● 初めて Linux や AWS を実務で触った 3社目(GMOペパボ) ● システムの運用経験なしで入社

Slide 7

Slide 7 text

7 3. GMOペパボへ入社

Slide 8

Slide 8 text

8 “ 分からないことが多すぎる...” GMOペパボへ入社

Slide 9

Slide 9 text

使っている技術スタックの幅が広くて、分からないことだらけだった。 新卒の頃にインフラに興味を持ってから、自分なりに勉強してきたつもりだったけど、 学んだことを実務でどのように活用していくとよいかあまり分かっていなかった。 9 コンテナ技術 分からない Linux 分からない システムの障害対応 分からない 9 GMOペパボへ入社

Slide 10

Slide 10 text

10 システムの障害対応、Linux、Kubernetes 分からない • システム障害の発生時にどうやって対応すると良いか分からない ○ ログやモニタリングの確認方法が分からない • Linux を実務であまり触ってこなかった ○ 基本的なコマンドは分かっていたけど... ○ Nginx や メールのログの場所が分からない • コンテナ技術、特に Kubernetes がよく分からない ○ Kubernetes を構成するコンポーネントの役割が分かっていない ○ Prometheus, Grafana, Datadog... GMOペパボへ入社

Slide 11

Slide 11 text

11 4. 半年でやってきたこと

Slide 12

Slide 12 text

12 システムの障害対応が分からないなかでやってきたこと • システム障害の発生時は、何が問題になっていて、何を解決すると良いか考える • Slack や GHES の Issue から類似していそうなものを探してくる ○ 実際に一連の調査・対応を同じようにコマンドを実行してみる ○ 得られた結果からどういったことが分かるのかを理解する ○ 最後に自分なりに内容を整理してまとめる 半年でやってきたこと

Slide 13

Slide 13 text

13 Linux が分からないなかでやってきたこと • Linux を体系的に学ぶために LPIC-2 を取った ○ Nginx, DNS, SSL証明書やメール等の知識が身についた ○ 全然分からない、聞いたことがないから脱却することができた ○ チームでの会話の内容が以前よりも理解できるようになった ○ 全く分からないが減ったのでスプリントタスクでも役立った 半年でやってきたこと

Slide 14

Slide 14 text

14 コンテナ技術が分からないなかでやってきたこと • 実際に手を動かして Kubernetes クラスタの再作成をした ○ Kubernetes のコンポーネントをひとつひとつ理解しながら進める ○ チームの方にサポートをしてもらいながら、不明点は解消して進める ○ 逐次 GHES の gist にやったことを記録しながら進めてやりきった 半年でやってきたこと

Slide 15

Slide 15 text

15 “ 少しずつ分かることが増えた ” 半年でやってきたこと

Slide 16

Slide 16 text

16 やったこと • OpenStack と AWS 上に Terraform でサーバ構築 • Puppet でサーバの構成管理 • Mackerel による監視設定の追加・変更 • メール(DNSBL, IPレピュテーション...etc)の対応 • メールサーバの移設 • SLO 違反に繋がりそうな原因の調査 • SSL証明書の更新作業 • Kubernetes クラスタの再作成 ...etc 半年でやってきたこと

Slide 17

Slide 17 text

17 5. 今後やっていきたいこと

Slide 18

Slide 18 text

18 もっともっと運用スキルを身につけていきたい • サービスの基盤となっているプライベートクラウド(OpenStack)と パブリッククラウド(AWS)のインフラ構築・運用スキルを身につける • インフラのコスト最適化にも取り組んでいく • サービスの信頼性向上に必要なことはすべてチャレンジしていきたい!!! 今後やっていきたいこと

Slide 19

Slide 19 text

19 6. まとめ

Slide 20

Slide 20 text

まとめ 20 ● 入社前からやりたかったインフラの仕事ができている ● VM や クラウド、幅広い技術を触ることができていて、 半年で分かることがとても増えた ● チームに活気があり、優秀なエンジニアの方と一緒に ワイワイ楽しく仕事ができている ● これからも自分のできることを増やしていきつつ、 チームのみんなと一緒により良いサービスを提供して いきます!!! GMOペパボのSREになってみて

Slide 21

Slide 21 text

ご静聴ありがとうございました!!! 21