Slide 1

Slide 1 text

No content

Slide 2

Slide 2 text

WHOAMI CONFIDENTIAL | AUTHORIZED 2 - name: Tetsuya Isogai (磯貝哲也) - company: Hewlett Packard Enterprise - organization: WW Pointnext Hybrid IT Practice - role: Solution Architect / Consultant - Certificates: - Certified Kubernetes Administrator (2019 & 2020 Renewed) / Certified Kubernetes Application Developer / Red Hat Certified Specialist in OpenShift / PMP / AWS SAA - Speaker: - HPE x Red Hat co-event (Online) - SNS: - Twitter: @IsogaiTetsuya - Blog: medium.com/@tetsuya.isogai #kubeadmin消してない人は怒らないから出てきなさい

Slide 3

Slide 3 text

• OTAまじすげぇ • けど完璧なものはない • Upgradeしやすいってどんなこと? ※OpenShift等の導入を検討している エンタープライズITの方向き ※インフラ寄りの話 CONFIDENTIAL | AUTHORIZED 3 AGENDA

Slide 4

Slide 4 text

• クラスターバージョンの定義 • [メジャーバージョン (x) ].[マイナーバージョン (y) ].[パッチ (z) ] (例:4.5.1) • パッチは決められたアップグレードパスの制約に上でスキップできる 例:4.5.1 -> 4.5.3 • アップグレードチャネル • Candidate : GA前のリリースを含む • Fast : 更新が利用可能になるとすぐに配信される試作環境、QA環境 • Stable : fastチャネルの更新後RH社による追加のテストをパスした場合Stableチャネルでリリー スされる • 特定のクラスタバージョンの更新のみ配信される(例: stable-4.5 -> 4.5.1, 4.5.2 …) • Over-the-Air Upgrade • 要はボタンポチ―でクラスタのUpgradeができる機能 • マイナーバージョンの1つ上に対するUpgradeに対して利用可能 • ダウングレード/ロールバックは不可 基本的な情報は赤帽エンジニアブログ(田中さん著)にすべてが載っている https://rheb.hatenablog.com/entry/openshift4-ota-update CONFIDENTIAL | AUTHORIZED 4 OPENSHIFT CLUSTER UPGRADE BASICS

Slide 5

Slide 5 text

• 1マイナーバージョンあたり のFull Support期間は4か月 • Maintenance Support Endは3つ 先のマイナーバージョンリ リースまで CONFIDENTIAL | AUTHORIZED 5 1マイナーバージョン当たりのサポート期間 https://access.redhat.com/support/policy/updates/openshift

Slide 6

Slide 6 text

• Cluster Version Operator(CVO) はWatcher(Quay上の新しいイ メージを自動的に検出する 機構)から更新可能なバー ジョンのリストを受け取る • Upgradeの指示を管理者から 受けると個々のコンポーネ ントのオペレータがOLMの 管理下の元Upgradeされる • Node OSも更新がある場合一 緒に更新される(rpm-ostree) CONFIDENTIAL | AUTHORIZED 6 UPDATEアーキテクチャ OLMと言えば! https://event.cloudnativedays.jp/cndt2020/talks/23

Slide 7

Slide 7 text

CONFIDENTIAL | AUTHORIZED

Slide 8

Slide 8 text

CONFIDENTIAL | AUTHORIZED

Slide 9

Slide 9 text

No content

Slide 10

Slide 10 text

[小ネタ] UPGRADE後の状態をさくっと確認… $ oc get co co = clusteroperator 利点: • コマンドが覚えやすい • Cluster Version Operatorによって管 理されるオペレータの状態、バー ジョンが一覧化できる おーしー げっと こー!

Slide 11

Slide 11 text

No content

Slide 12

Slide 12 text

見てみましょう

Slide 13

Slide 13 text

• 楽には違いないけど当然ながら無風ではない • OAuthもUpgrade… じゃそれの更新に失敗したら? • Etcdはバックアップしろと書いてあるなそういえば https://docs.openshift.com/container-platform/4.5/updating/updating-cluster-between- minor.html#prerequisites • ノードが再起動する→周辺環境(Network Accessibility / NTP / DNS / Low level Infrastructure…)が Healthyであることが前提 CONFIDENTIAL | AUTHORIZED 13 どうでしたか?

Slide 14

Slide 14 text

CONFIDENTIAL | AUTHORIZED 14 何が辛いのか? エラー発生時のトラブルシューティング ステークホルダーとの調整 ドキュメンテーション そもそも頻度が アップグレード後の検証

Slide 15

Slide 15 text

CONFIDENTIAL | AUTHORIZED 15 どうすればいい? エラー発生時のトラブルシューティング ステークホルダーとの調整 ドキュメンテーション そもそも頻度が アップグレード後の検証 インフラチームで事前検証/事象再現が自由に できる環境を確保する 適切なクラスタの範囲を検討する そもそもの在り方をみなおす 自動化 自動化(アプリケーションチームとの連携)

Slide 16

Slide 16 text

CONFIDENTIAL | AUTHORIZED 16 どうすればいい? エラー発生時のトラブルシューティング ステークホルダーとの調整 ドキュメンテーション そもそも頻度が アップグレード後の検証 インフラチームで事前検証/事象再現が自由に できる環境を確保する 適切なクラスタの範囲を検討する そもそもの在り方をみなおす 自動化 自動化(アプリケーションチームとの連携)

Slide 17

Slide 17 text

• OTAはボタン一つでノードまで含めてローリングアップグレードしてくれる粋なやつ • 準備が不要になるわけではない、環境と手段の両面でより安全かつ効率的なUpgrade • 環境:検証環境、ステージの考え方、クラスタ分割ポリシー… • 手段:バックアップ、テスト、自動化、アプリケーションチームとの協業… • 製品は日々成長、継続した投資によってより良いプラットフォームへ CONFIDENTIAL | AUTHORIZED 17 まとめ

Slide 18

Slide 18 text

THANK YOU CONFIDENTIAL | AUTHORIZED 18