Upgrade to Pro — share decks privately, control downloads, hide ads and more …

「SRE初心者からの挑戦! 半年でやってきたことと今後の展望」

haruki
April 14, 2023
1.1k

「SRE初心者からの挑戦! 半年でやってきたことと今後の展望」

haruki

April 14, 2023
Tweet

Transcript

  1. GMOペパボ 技術部 プラットフォームグループ  2022年9月 中途入社 4 自己紹介 上島 春輝 Uejima Haruki •

    初登壇です!!! • 社内では harukin と呼ばれている • 主にカラーミーショップの運用に携わっている • 自宅に Kubernetesクラスタを飼いたいです Twitter : @harukin721
  2. これまでの経歴 6 新卒(SES) • Linux や AWS の実務経験はなし (Javaを少し..) •

    LPIC-1, AWS CLF,SAA,DVA,SOA 2社目(スタートアップ) • 新規社内システムのインフラをAWSで構築 • 初めて Linux や AWS を実務で触った 3社目(GMOペパボ) • システムの運用経験なしで入社
  3. 10 システムの障害対応、Linux、Kubernetes 分からない • システム障害の発生時にどうやって対応すると良いか分からない ◦ ログやモニタリングの確認方法が分からない • Linux を実務であまり触ってこなかった

    ◦ 基本的なコマンドは分かっていたけど... ◦ Nginx や メールのログの場所が分からない • コンテナ技術、特に Kubernetes がよく分からない ◦ Kubernetes を構成するコンポーネントの役割が分かっていない ◦ Prometheus, Grafana, Datadog... GMOペパボへ入社
  4. 12 システムの障害対応が分からないなかでやってきたこと • システム障害の発生時は、何が問題になっていて、何を解決すると良いか考える • Slack や GHES の Issue

    から類似していそうなものを探してくる ◦ 実際に一連の調査・対応を同じようにコマンドを実行してみる ◦ 得られた結果からどういったことが分かるのかを理解する ◦ 最後に自分なりに内容を整理してまとめる 半年でやってきたこと
  5. 13 Linux が分からないなかでやってきたこと • Linux を体系的に学ぶために LPIC-2 を取った ◦ Nginx,

    DNS, SSL証明書やメール等の知識が身についた ◦ 全然分からない、聞いたことがないから脱却することができた ◦ チームでの会話の内容が以前よりも理解できるようになった ◦ 全く分からないが減ったのでスプリントタスクでも役立った 半年でやってきたこと
  6. 14 コンテナ技術が分からないなかでやってきたこと • 実際に手を動かして Kubernetes クラスタの再作成をした ◦ Kubernetes のコンポーネントをひとつひとつ理解しながら進める ◦

    チームの方にサポートをしてもらいながら、不明点は解消して進める ◦ 逐次 GHES の gist にやったことを記録しながら進めてやりきった 半年でやってきたこと
  7. 16 やったこと • OpenStack と AWS 上に Terraform でサーバ構築 •

    Puppet でサーバの構成管理 • Mackerel による監視設定の追加・変更 • メール(DNSBL, IPレピュテーション...etc)の対応 • メールサーバの移設 • SLO 違反に繋がりそうな原因の調査 • SSL証明書の更新作業 • Kubernetes クラスタの再作成 ...etc 半年でやってきたこと
  8. まとめ 20 • 入社前からやりたかったインフラの仕事ができている • VM や クラウド、幅広い技術を触ることができていて、 半年で分かることがとても増えた •

    チームに活気があり、優秀なエンジニアの方と一緒に ワイワイ楽しく仕事ができている • これからも自分のできることを増やしていきつつ、 チームのみんなと一緒により良いサービスを提供して いきます!!! GMOペパボのSREになってみて