Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
障害や災害に負けない!回復性を高めるクラウド設計
Search
ShowNet
PRO
February 22, 2023
0
1.3k
障害や災害に負けない!回復性を高めるクラウド設計
ShowNet.conf_ での講演資料
ShowNet
PRO
February 22, 2023
Tweet
Share
More Decks by ShowNet
See All by ShowNet
【swonet.conf_ 2025】AI技術 x 高精度な監視データ収集で築くインテリジェントな運用・監視基盤
shownet
PRO
0
120
【swonet.conf_ 2025】ゼロトラストで支える広帯域セキュリティサービスと脅威監視基盤
shownet
PRO
0
150
【swonet.conf_ 2025】効率化と見える化で進化し続けるファシリティの構築
shownet
PRO
0
110
【swonet.conf_ 2025】ShowNet Watt Quest ~ネットワーク省電力化に向けた計測・分析~
shownet
PRO
0
110
【swonet.conf_ 2025】オープニングセッション
shownet
PRO
0
370
【swonet.conf_ 2025】ShowNet基礎知識
shownet
PRO
0
210
【swonet.conf_ 2025】ShowNet Media-X : ShowNetがつないだ放送のミライ
shownet
PRO
0
130
【swonet.conf_ 2025】AI基盤からエッジまで、多様化するネットワークとテストの進化
shownet
PRO
0
110
【swonet.conf_ 2025】SRv6 による k8s マルチテナント環境と次世代 AI ネットワーク/サービス基盤
shownet
PRO
0
150
Featured
See All Featured
Code Reviewing Like a Champion
maltzj
527
40k
Fireside Chat
paigeccino
41
3.8k
Lightning talk: Run Django tests with GitHub Actions
sabderemane
0
120
The innovator’s Mindset - Leading Through an Era of Exponential Change - McGill University 2025
jdejongh
PRO
1
96
Done Done
chrislema
186
16k
How to train your dragon (web standard)
notwaldorf
97
6.5k
The Impact of AI in SEO - AI Overviews June 2024 Edition
aleyda
5
740
Accessibility Awareness
sabderemane
0
58
The Pragmatic Product Professional
lauravandoore
37
7.1k
The Anti-SEO Checklist Checklist. Pubcon Cyber Week
ryanjones
0
70
Producing Creativity
orderedlist
PRO
348
40k
JAMstack: Web Apps at Ludicrous Speed - All Things Open 2022
reverentgeek
1
350
Transcript
障害や災害に負けない! 回復性を高めるクラウド設計 Interop Tokyo 2022 ShowNet NOC チームメンバー クラウド担当 宇田
周平
• 障害や災害に負けない!回復性を高めるクラウド設計 • クラウド時代の新常識、あらゆる障害を想定した冗長設計 • カオスエンジニアリングを意識した障害試験と実運用 • ShowNet の運用管理を支える多彩なアプライアンスとクラウドサービス •
進化したハイブリッドクラウド統合管理 ShowNet 2022 クラウド テーマ
None
昨年を振り返って.. • マルチ クラウド環境の 相互接続・統合管理 • Infrastructure as Code によるデプロイの自動化
ただ、単一障害点 (SPOF) が 多数存在しており、課題も…
• 2 リージョンでの冗長構成 • 単一リージョン内でのゾーン冗長構成 • VM のレプリケーションによる DR 対策
• Interconnect の東西冗長、キャリア冗長 今年は冗長構成や災害対策を視野に設計
• 多くの VM を Japan East / West US で冗長化
2 リージョンでの冗長構成
Japan East Availability Zone 1 Availability Zone 2 Availability Zone
3 データセンター単位の障害への備え • ゾーン (AZ) 冗長 電源や空調等が独立しているため、 仮想マシンを異なるゾーンに分散 配置することで、データセンター 単位の障害への耐性が向上 同一リージョン内なので、遅延も 比較的小さく済む (数 ms 程度)
Zabbix 6.0 の HA 機能で障害試験 1 号機から 2 号機へ 正常にフェールオーバー
Azure 上で稼働する Zabbix Appliance のアクティブ側をダウンさせ、 HA 構成が期待通りに機能することを確認
• 3 回線の Interconnect で東西冗長・キャリア冗長の構成 • NTTコミュニケーションズ様 Smart Data Platform
(東京/大阪) • ブロードバンドタワー様 dc.connect NeX (東京) • ThousandEyes を用いた経路監視 Interconnect の障害に対する備え
• System Answer G3 を構成する VM 4 台を Japan East
から West US へ複製し、DR 対策を想定したフェールオーバー、 フェールバック試験を実施 別リージョンへのレプリケーション
別リージョンへフェールオーバーする際の留意点 • DB サーバー等、依存関係のあるサーバーを IP アドレス で参照している場合、移行後に書き換えが必要 • 移行先のリージョンでクォーターやキャパシティを十分に 確保しておくことが重要
• ShowNet の Azure Stack HCI 基盤上で稼働している VM をパブ リック
クラウドの Azure 上へ複製 オンプレミスからクラウドへのレプリケーション
• クラウドのポータルからオンプレミスの仮想マシンも一元管理 • ShowNet の仮想化基盤 (Azure Stack HCI 環境) •
日本ヒューレット・パッカード様 検証センター (VMware 環境) ハイブリッド クラウドの統合管理 幕張メッセ dl380-1,2 dl380@hpe-lab HPE 検証センター EdgeConnect Enterprise XS Azure mx204.kote ne8000-x4 EdgeConnect Enterprise Virtual
• クラウドのポータルからオンプレミスの仮想マシンも一元管理 • ShowNet の仮想化基盤 (Azure Stack HCI 環境) •
日本ヒューレット・パッカード様 検証センター (VMware 環境) ハイブリッド クラウドの統合管理
• クラウド上のリソース構成を一括チェック • ログ取得設定の抜け漏れ • SSH / RDP 通信の不用意な許可 •
ストレージやデータベースの意図せぬ外部公開 CSPM による設定不備の検出
ご協力いただいたコントリビューター様
None