Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Upgrade 4.4 to 4.5 with OTA その裏側

9f481df7e7f978eb6ab93a5cfffcdc20?s=47 Tetsuya Isogai
September 25, 2020
410

Upgrade 4.4 to 4.5 with OTA その裏側

OpenShiftの強力な機能の一つである自動アップグレード機能。GUIからボタンを押すだけでUpgradeができ、Upgradeにまつわるユーザの負担の大部分を軽減させてくれます。一方ですべて自動で行われるため、万が一のトラブルに備えて事前にその流れを把握しておくことは無駄ではありません。本LTでは4.4→4.5へのUpgradeのプロセスを収録した動画から紐解くとともに、Upgradeしやすい環境についての考察を発表します。

9f481df7e7f978eb6ab93a5cfffcdc20?s=128

Tetsuya Isogai

September 25, 2020
Tweet

Transcript

  1. None
  2. WHOAMI CONFIDENTIAL | AUTHORIZED 2 - name: Tetsuya Isogai (磯貝哲也)

    - company: Hewlett Packard Enterprise - organization: WW Pointnext Hybrid IT Practice - role: Solution Architect / Consultant - Certificates: - Certified Kubernetes Administrator (2019 & 2020 Renewed) / Certified Kubernetes Application Developer / Red Hat Certified Specialist in OpenShift / PMP / AWS SAA - Speaker: - HPE x Red Hat co-event (Online) - SNS: - Twitter: @IsogaiTetsuya - Blog: medium.com/@tetsuya.isogai #kubeadmin消してない人は怒らないから出てきなさい
  3. • OTAまじすげぇ • けど完璧なものはない • Upgradeしやすいってどんなこと? ※OpenShift等の導入を検討している エンタープライズITの方向き ※インフラ寄りの話 CONFIDENTIAL

    | AUTHORIZED 3 AGENDA
  4. • クラスターバージョンの定義 • [メジャーバージョン (x) ].[マイナーバージョン (y) ].[パッチ (z) ]

    (例:4.5.1) • パッチは決められたアップグレードパスの制約に上でスキップできる 例:4.5.1 -> 4.5.3 • アップグレードチャネル • Candidate : GA前のリリースを含む • Fast : 更新が利用可能になるとすぐに配信される試作環境、QA環境 • Stable : fastチャネルの更新後RH社による追加のテストをパスした場合Stableチャネルでリリー スされる • 特定のクラスタバージョンの更新のみ配信される(例: stable-4.5 -> 4.5.1, 4.5.2 …) • Over-the-Air Upgrade • 要はボタンポチ―でクラスタのUpgradeができる機能 • マイナーバージョンの1つ上に対するUpgradeに対して利用可能 • ダウングレード/ロールバックは不可 基本的な情報は赤帽エンジニアブログ(田中さん著)にすべてが載っている https://rheb.hatenablog.com/entry/openshift4-ota-update CONFIDENTIAL | AUTHORIZED 4 OPENSHIFT CLUSTER UPGRADE BASICS
  5. • 1マイナーバージョンあたり のFull Support期間は4か月 • Maintenance Support Endは3つ 先のマイナーバージョンリ リースまで

    CONFIDENTIAL | AUTHORIZED 5 1マイナーバージョン当たりのサポート期間 https://access.redhat.com/support/policy/updates/openshift
  6. • Cluster Version Operator(CVO) はWatcher(Quay上の新しいイ メージを自動的に検出する 機構)から更新可能なバー ジョンのリストを受け取る • Upgradeの指示を管理者から

    受けると個々のコンポーネ ントのオペレータがOLMの 管理下の元Upgradeされる • Node OSも更新がある場合一 緒に更新される(rpm-ostree) CONFIDENTIAL | AUTHORIZED 6 UPDATEアーキテクチャ OLMと言えば! https://event.cloudnativedays.jp/cndt2020/talks/23
  7. CONFIDENTIAL | AUTHORIZED

  8. CONFIDENTIAL | AUTHORIZED

  9. None
  10. [小ネタ] UPGRADE後の状態をさくっと確認… $ oc get co co = clusteroperator 利点:

    • コマンドが覚えやすい • Cluster Version Operatorによって管 理されるオペレータの状態、バー ジョンが一覧化できる おーしー げっと こー!
  11. None
  12. 見てみましょう

  13. • 楽には違いないけど当然ながら無風ではない • OAuthもUpgrade… じゃそれの更新に失敗したら? • Etcdはバックアップしろと書いてあるなそういえば https://docs.openshift.com/container-platform/4.5/updating/updating-cluster-between- minor.html#prerequisites •

    ノードが再起動する→周辺環境(Network Accessibility / NTP / DNS / Low level Infrastructure…)が Healthyであることが前提 CONFIDENTIAL | AUTHORIZED 13 どうでしたか?
  14. CONFIDENTIAL | AUTHORIZED 14 何が辛いのか? エラー発生時のトラブルシューティング ステークホルダーとの調整 ドキュメンテーション そもそも頻度が アップグレード後の検証

  15. CONFIDENTIAL | AUTHORIZED 15 どうすればいい? エラー発生時のトラブルシューティング ステークホルダーとの調整 ドキュメンテーション そもそも頻度が アップグレード後の検証

    インフラチームで事前検証/事象再現が自由に できる環境を確保する 適切なクラスタの範囲を検討する そもそもの在り方をみなおす 自動化 自動化(アプリケーションチームとの連携)
  16. CONFIDENTIAL | AUTHORIZED 16 どうすればいい? エラー発生時のトラブルシューティング ステークホルダーとの調整 ドキュメンテーション そもそも頻度が アップグレード後の検証

    インフラチームで事前検証/事象再現が自由に できる環境を確保する 適切なクラスタの範囲を検討する そもそもの在り方をみなおす 自動化 自動化(アプリケーションチームとの連携)
  17. • OTAはボタン一つでノードまで含めてローリングアップグレードしてくれる粋なやつ • 準備が不要になるわけではない、環境と手段の両面でより安全かつ効率的なUpgrade • 環境:検証環境、ステージの考え方、クラスタ分割ポリシー… • 手段:バックアップ、テスト、自動化、アプリケーションチームとの協業… • 製品は日々成長、継続した投資によってより良いプラットフォームへ

    CONFIDENTIAL | AUTHORIZED 17 まとめ
  18. THANK YOU CONFIDENTIAL | AUTHORIZED 18