Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
障害や災害に負けない!回復性を高めるクラウド設計
Search
ShowNet
PRO
February 22, 2023
0
980
障害や災害に負けない!回復性を高めるクラウド設計
ShowNet.conf_ での講演資料
ShowNet
PRO
February 22, 2023
Tweet
Share
More Decks by ShowNet
See All by ShowNet
【shownet.conf_】ShowNet 2024 ~ Inter * Network ~
shownet
PRO
0
770
【shownet.conf_】ShowNet伝送改めShowNet APN 2024
shownet
PRO
0
640
【shownet.conf_】コンピューティング資源を統合した分散コンテナ基盤の進化
shownet
PRO
0
610
【shownet.conf_】ShowNet x 宇宙ネットワーク
shownet
PRO
0
580
【shownet.conf_】多様化するネットワーク環境を柔軟に統合するルーティングテクノロジー
shownet
PRO
0
560
【shownet.conf_】3Dアプローチで守るセキュリティ
shownet
PRO
0
560
【shownet.conf_】トポロジ図の歩き方
shownet
PRO
0
750
【shownet.conf_】AI技術とUX監視の応用でShowNetの基盤を支えるモニタリングシステム
shownet
PRO
0
560
【shownet.conf_】ローカル5Gを活用したウォーキングツアーの体感向上
shownet
PRO
0
520
Featured
See All Featured
Build The Right Thing And Hit Your Dates
maggiecrowley
33
2.4k
Being A Developer After 40
akosma
87
590k
The MySQL Ecosystem @ GitHub 2015
samlambert
250
12k
Practical Orchestrator
shlominoach
186
10k
Thoughts on Productivity
jonyablonski
67
4.3k
Typedesign – Prime Four
hannesfritz
40
2.4k
The Success of Rails: Ensuring Growth for the Next 100 Years
eileencodes
44
6.8k
Fight the Zombie Pattern Library - RWD Summit 2016
marcelosomers
232
17k
Designing for Performance
lara
604
68k
Learning to Love Humans: Emotional Interface Design
aarron
273
40k
Java REST API Framework Comparison - PWX 2021
mraible
PRO
28
8.2k
ピンチをチャンスに:未来をつくるプロダクトロードマップ #pmconf2020
aki_iinuma
109
49k
Transcript
障害や災害に負けない! 回復性を高めるクラウド設計 Interop Tokyo 2022 ShowNet NOC チームメンバー クラウド担当 宇田
周平
• 障害や災害に負けない!回復性を高めるクラウド設計 • クラウド時代の新常識、あらゆる障害を想定した冗長設計 • カオスエンジニアリングを意識した障害試験と実運用 • ShowNet の運用管理を支える多彩なアプライアンスとクラウドサービス •
進化したハイブリッドクラウド統合管理 ShowNet 2022 クラウド テーマ
None
昨年を振り返って.. • マルチ クラウド環境の 相互接続・統合管理 • Infrastructure as Code によるデプロイの自動化
ただ、単一障害点 (SPOF) が 多数存在しており、課題も…
• 2 リージョンでの冗長構成 • 単一リージョン内でのゾーン冗長構成 • VM のレプリケーションによる DR 対策
• Interconnect の東西冗長、キャリア冗長 今年は冗長構成や災害対策を視野に設計
• 多くの VM を Japan East / West US で冗長化
2 リージョンでの冗長構成
Japan East Availability Zone 1 Availability Zone 2 Availability Zone
3 データセンター単位の障害への備え • ゾーン (AZ) 冗長 電源や空調等が独立しているため、 仮想マシンを異なるゾーンに分散 配置することで、データセンター 単位の障害への耐性が向上 同一リージョン内なので、遅延も 比較的小さく済む (数 ms 程度)
Zabbix 6.0 の HA 機能で障害試験 1 号機から 2 号機へ 正常にフェールオーバー
Azure 上で稼働する Zabbix Appliance のアクティブ側をダウンさせ、 HA 構成が期待通りに機能することを確認
• 3 回線の Interconnect で東西冗長・キャリア冗長の構成 • NTTコミュニケーションズ様 Smart Data Platform
(東京/大阪) • ブロードバンドタワー様 dc.connect NeX (東京) • ThousandEyes を用いた経路監視 Interconnect の障害に対する備え
• System Answer G3 を構成する VM 4 台を Japan East
から West US へ複製し、DR 対策を想定したフェールオーバー、 フェールバック試験を実施 別リージョンへのレプリケーション
別リージョンへフェールオーバーする際の留意点 • DB サーバー等、依存関係のあるサーバーを IP アドレス で参照している場合、移行後に書き換えが必要 • 移行先のリージョンでクォーターやキャパシティを十分に 確保しておくことが重要
• ShowNet の Azure Stack HCI 基盤上で稼働している VM をパブ リック
クラウドの Azure 上へ複製 オンプレミスからクラウドへのレプリケーション
• クラウドのポータルからオンプレミスの仮想マシンも一元管理 • ShowNet の仮想化基盤 (Azure Stack HCI 環境) •
日本ヒューレット・パッカード様 検証センター (VMware 環境) ハイブリッド クラウドの統合管理 幕張メッセ dl380-1,2 dl380@hpe-lab HPE 検証センター EdgeConnect Enterprise XS Azure mx204.kote ne8000-x4 EdgeConnect Enterprise Virtual
• クラウドのポータルからオンプレミスの仮想マシンも一元管理 • ShowNet の仮想化基盤 (Azure Stack HCI 環境) •
日本ヒューレット・パッカード様 検証センター (VMware 環境) ハイブリッド クラウドの統合管理
• クラウド上のリソース構成を一括チェック • ログ取得設定の抜け漏れ • SSH / RDP 通信の不用意な許可 •
ストレージやデータベースの意図せぬ外部公開 CSPM による設定不備の検出
ご協力いただいたコントリビューター様
None