Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
障害や災害に負けない!回復性を高めるクラウド設計
Search
ShowNet
PRO
February 22, 2023
0
1k
障害や災害に負けない!回復性を高めるクラウド設計
ShowNet.conf_ での講演資料
ShowNet
PRO
February 22, 2023
Tweet
Share
More Decks by ShowNet
See All by ShowNet
【shownet.conf_】ShowNet 2024 ~ Inter * Network ~
shownet
PRO
0
1.1k
【shownet.conf_】ShowNet伝送改めShowNet APN 2024
shownet
PRO
0
930
【shownet.conf_】コンピューティング資源を統合した分散コンテナ基盤の進化
shownet
PRO
0
890
【shownet.conf_】ShowNet x 宇宙ネットワーク
shownet
PRO
0
830
【shownet.conf_】多様化するネットワーク環境を柔軟に統合するルーティングテクノロジー
shownet
PRO
0
820
【shownet.conf_】3Dアプローチで守るセキュリティ
shownet
PRO
0
810
【shownet.conf_】トポロジ図の歩き方
shownet
PRO
0
1.1k
【shownet.conf_】AI技術とUX監視の応用でShowNetの基盤を支えるモニタリングシステム
shownet
PRO
0
810
【shownet.conf_】ローカル5Gを活用したウォーキングツアーの体感向上
shownet
PRO
0
750
Featured
See All Featured
Keith and Marios Guide to Fast Websites
keithpitt
410
22k
StorybookのUI Testing Handbookを読んだ
zakiyama
28
5.4k
Statistics for Hackers
jakevdp
797
220k
How GitHub (no longer) Works
holman
312
140k
Chrome DevTools: State of the Union 2024 - Debugging React & Beyond
addyosmani
3
260
BBQ
matthewcrist
85
9.4k
The Web Performance Landscape in 2024 [PerfNow 2024]
tammyeverts
3
370
Designing for humans not robots
tammielis
250
25k
The Art of Delivering Value - GDevCon NA Keynote
reverentgeek
8
1.3k
Fashionably flexible responsive web design (full day workshop)
malarkey
406
66k
Faster Mobile Websites
deanohume
305
30k
The Success of Rails: Ensuring Growth for the Next 100 Years
eileencodes
44
7k
Transcript
障害や災害に負けない! 回復性を高めるクラウド設計 Interop Tokyo 2022 ShowNet NOC チームメンバー クラウド担当 宇田
周平
• 障害や災害に負けない!回復性を高めるクラウド設計 • クラウド時代の新常識、あらゆる障害を想定した冗長設計 • カオスエンジニアリングを意識した障害試験と実運用 • ShowNet の運用管理を支える多彩なアプライアンスとクラウドサービス •
進化したハイブリッドクラウド統合管理 ShowNet 2022 クラウド テーマ
None
昨年を振り返って.. • マルチ クラウド環境の 相互接続・統合管理 • Infrastructure as Code によるデプロイの自動化
ただ、単一障害点 (SPOF) が 多数存在しており、課題も…
• 2 リージョンでの冗長構成 • 単一リージョン内でのゾーン冗長構成 • VM のレプリケーションによる DR 対策
• Interconnect の東西冗長、キャリア冗長 今年は冗長構成や災害対策を視野に設計
• 多くの VM を Japan East / West US で冗長化
2 リージョンでの冗長構成
Japan East Availability Zone 1 Availability Zone 2 Availability Zone
3 データセンター単位の障害への備え • ゾーン (AZ) 冗長 電源や空調等が独立しているため、 仮想マシンを異なるゾーンに分散 配置することで、データセンター 単位の障害への耐性が向上 同一リージョン内なので、遅延も 比較的小さく済む (数 ms 程度)
Zabbix 6.0 の HA 機能で障害試験 1 号機から 2 号機へ 正常にフェールオーバー
Azure 上で稼働する Zabbix Appliance のアクティブ側をダウンさせ、 HA 構成が期待通りに機能することを確認
• 3 回線の Interconnect で東西冗長・キャリア冗長の構成 • NTTコミュニケーションズ様 Smart Data Platform
(東京/大阪) • ブロードバンドタワー様 dc.connect NeX (東京) • ThousandEyes を用いた経路監視 Interconnect の障害に対する備え
• System Answer G3 を構成する VM 4 台を Japan East
から West US へ複製し、DR 対策を想定したフェールオーバー、 フェールバック試験を実施 別リージョンへのレプリケーション
別リージョンへフェールオーバーする際の留意点 • DB サーバー等、依存関係のあるサーバーを IP アドレス で参照している場合、移行後に書き換えが必要 • 移行先のリージョンでクォーターやキャパシティを十分に 確保しておくことが重要
• ShowNet の Azure Stack HCI 基盤上で稼働している VM をパブ リック
クラウドの Azure 上へ複製 オンプレミスからクラウドへのレプリケーション
• クラウドのポータルからオンプレミスの仮想マシンも一元管理 • ShowNet の仮想化基盤 (Azure Stack HCI 環境) •
日本ヒューレット・パッカード様 検証センター (VMware 環境) ハイブリッド クラウドの統合管理 幕張メッセ dl380-1,2 dl380@hpe-lab HPE 検証センター EdgeConnect Enterprise XS Azure mx204.kote ne8000-x4 EdgeConnect Enterprise Virtual
• クラウドのポータルからオンプレミスの仮想マシンも一元管理 • ShowNet の仮想化基盤 (Azure Stack HCI 環境) •
日本ヒューレット・パッカード様 検証センター (VMware 環境) ハイブリッド クラウドの統合管理
• クラウド上のリソース構成を一括チェック • ログ取得設定の抜け漏れ • SSH / RDP 通信の不用意な許可 •
ストレージやデータベースの意図せぬ外部公開 CSPM による設定不備の検出
ご協力いただいたコントリビューター様
None