Upgrade to Pro — share decks privately, control downloads, hide ads and more …

初クラスタアップグレードの失敗と学び / First Cluster Upgrade Failure and Learning

初クラスタアップグレードの失敗と学び / First Cluster Upgrade Failure and Learning

■イベント :Kubernetes Meetup Tokyo #59
https://k8sjp.connpass.com/event/288488/

■登壇概要

タイトル:初クラスタアップグレードの失敗と学び
発表者: 技術本部 研究開発部 Architectグループ 新井和弥

◉ 研究開発職 採用情報
募集中のポジションや関連記事など
https://media.sansan-engineering.com/

◉ Sansan Tech Blog
Sansanのものづくりを支えるメンバーのテックブログ(R&Dメンバーの連載も多数)

https://buildersbox.corp-sansan.com/

Sansan R&D

July 19, 2023
Tweet

More Decks by Sansan R&D

Other Decks in Technology

Transcript

  1. 写真が入ります 新井 和弥 Sansan株式会社 技術本部 研究開発部 Architectグループ エンジニア 前職ではデータエンジニアとしてB2B SaaS企業のABMプラッ

    トフォームプロダクトの開発に従事。2022年Sansan株式会社⼊ 社。研究開発部Architectグループ ML Platform所属。研究員と ともにDevOps/MLOpsに向き合う。Kubernetesとの付き合い は1年くらい。 Please call me KAZY.
  2. Terraform applyするだけかと思いきや... - ⼀部変数を書き換えてApplyすれば新クラスタがサクッと⽴つ 👍 > Terraformのmoduleを利⽤して再利⽤準備 OK 👍👍 >

    既存クラスタのインフラで運⽤問題なし 👍👍👍 - クラスタは⽴ちません > エラー、エラー、エラー.... どうして.... - 試⾏錯誤中に本番環境のSecrets Managerを消してしまった 期待 現実🔥
  3. クラスタ移⾏中の想像不⾜ - クラスタ移⾏完了まで5ヶ⽉かかり 研究員(アプリ開発者)を混乱に陥れる > どちらのクラスタにデプロイしたら良いの? > 間違えて古い⽅のクラスタにデプロイしてしまった (TargetGroupBindingの暴⾛..) >

    Web UIからデプロイしたアプリが⾒えないよ? (Argo CD, Argo Workflows, Argo Rollouts..) 現実🔥 - アプリもまだ少ないしクラスタの移⾏はサクッ終わる👍 > クラスタ移⾏中は2クラスタ⽴つけど少しの我慢👍👍 期待
  4. クラスタ移⾏中の想像不⾜ - クラスタ移⾏中において、 研究員(アプリ開発者)への影響を軽視 - ユーザへの案内 > クラスタ移⾏中であることの周知 / 移⾏中⽤のWeb

    UIのURL発⾏ - Argo CD⽤クラスタ検討 > そもそも複数UIを持たせない - クラスタ移⾏のリードタイム削減 原因 対応