$30 off During Our Annual Pro Sale. View Details »
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
障害や災害に負けない!回復性を高めるクラウド設計
Search
ShowNet
PRO
February 22, 2023
0
1.2k
障害や災害に負けない!回復性を高めるクラウド設計
ShowNet.conf_ での講演資料
ShowNet
PRO
February 22, 2023
Tweet
Share
More Decks by ShowNet
See All by ShowNet
【swonet.conf_ 2025】AI技術 x 高精度な監視データ収集で築くインテリジェントな運用・監視基盤
shownet
PRO
0
22
【swonet.conf_ 2025】ゼロトラストで支える広帯域セキュリティサービスと脅威監視基盤
shownet
PRO
0
31
【swonet.conf_ 2025】効率化と見える化で進化し続けるファシリティの構築
shownet
PRO
0
20
【swonet.conf_ 2025】ShowNet Watt Quest ~ネットワーク省電力化に向けた計測・分析~
shownet
PRO
0
12
【swonet.conf_ 2025】オープニングセッション
shownet
PRO
0
14
【swonet.conf_ 2025】ShowNet基礎知識
shownet
PRO
0
28
【swonet.conf_ 2025】ShowNet Media-X : ShowNetがつないだ放送のミライ
shownet
PRO
0
30
【swonet.conf_ 2025】AI基盤からエッジまで、多様化するネットワークとテストの進化
shownet
PRO
0
12
【swonet.conf_ 2025】SRv6 による k8s マルチテナント環境と次世代 AI ネットワーク/サービス基盤
shownet
PRO
0
35
Featured
See All Featured
[SF Ruby Conf 2025] Rails X
palkan
0
540
Building Adaptive Systems
keathley
44
2.9k
Embracing the Ebb and Flow
colly
88
4.9k
Balancing Empowerment & Direction
lara
5
800
The MySQL Ecosystem @ GitHub 2015
samlambert
251
13k
How to Create Impact in a Changing Tech Landscape [PerfNow 2023]
tammyeverts
55
3.1k
Site-Speed That Sticks
csswizardry
13
1k
Design and Strategy: How to Deal with People Who Don’t "Get" Design
morganepeng
132
19k
4 Signs Your Business is Dying
shpigford
186
22k
Documentation Writing (for coders)
carmenintech
77
5.2k
Leading Effective Engineering Teams in the AI Era
addyosmani
9
1.3k
How to train your dragon (web standard)
notwaldorf
97
6.4k
Transcript
障害や災害に負けない! 回復性を高めるクラウド設計 Interop Tokyo 2022 ShowNet NOC チームメンバー クラウド担当 宇田
周平
• 障害や災害に負けない!回復性を高めるクラウド設計 • クラウド時代の新常識、あらゆる障害を想定した冗長設計 • カオスエンジニアリングを意識した障害試験と実運用 • ShowNet の運用管理を支える多彩なアプライアンスとクラウドサービス •
進化したハイブリッドクラウド統合管理 ShowNet 2022 クラウド テーマ
None
昨年を振り返って.. • マルチ クラウド環境の 相互接続・統合管理 • Infrastructure as Code によるデプロイの自動化
ただ、単一障害点 (SPOF) が 多数存在しており、課題も…
• 2 リージョンでの冗長構成 • 単一リージョン内でのゾーン冗長構成 • VM のレプリケーションによる DR 対策
• Interconnect の東西冗長、キャリア冗長 今年は冗長構成や災害対策を視野に設計
• 多くの VM を Japan East / West US で冗長化
2 リージョンでの冗長構成
Japan East Availability Zone 1 Availability Zone 2 Availability Zone
3 データセンター単位の障害への備え • ゾーン (AZ) 冗長 電源や空調等が独立しているため、 仮想マシンを異なるゾーンに分散 配置することで、データセンター 単位の障害への耐性が向上 同一リージョン内なので、遅延も 比較的小さく済む (数 ms 程度)
Zabbix 6.0 の HA 機能で障害試験 1 号機から 2 号機へ 正常にフェールオーバー
Azure 上で稼働する Zabbix Appliance のアクティブ側をダウンさせ、 HA 構成が期待通りに機能することを確認
• 3 回線の Interconnect で東西冗長・キャリア冗長の構成 • NTTコミュニケーションズ様 Smart Data Platform
(東京/大阪) • ブロードバンドタワー様 dc.connect NeX (東京) • ThousandEyes を用いた経路監視 Interconnect の障害に対する備え
• System Answer G3 を構成する VM 4 台を Japan East
から West US へ複製し、DR 対策を想定したフェールオーバー、 フェールバック試験を実施 別リージョンへのレプリケーション
別リージョンへフェールオーバーする際の留意点 • DB サーバー等、依存関係のあるサーバーを IP アドレス で参照している場合、移行後に書き換えが必要 • 移行先のリージョンでクォーターやキャパシティを十分に 確保しておくことが重要
• ShowNet の Azure Stack HCI 基盤上で稼働している VM をパブ リック
クラウドの Azure 上へ複製 オンプレミスからクラウドへのレプリケーション
• クラウドのポータルからオンプレミスの仮想マシンも一元管理 • ShowNet の仮想化基盤 (Azure Stack HCI 環境) •
日本ヒューレット・パッカード様 検証センター (VMware 環境) ハイブリッド クラウドの統合管理 幕張メッセ dl380-1,2 dl380@hpe-lab HPE 検証センター EdgeConnect Enterprise XS Azure mx204.kote ne8000-x4 EdgeConnect Enterprise Virtual
• クラウドのポータルからオンプレミスの仮想マシンも一元管理 • ShowNet の仮想化基盤 (Azure Stack HCI 環境) •
日本ヒューレット・パッカード様 検証センター (VMware 環境) ハイブリッド クラウドの統合管理
• クラウド上のリソース構成を一括チェック • ログ取得設定の抜け漏れ • SSH / RDP 通信の不用意な許可 •
ストレージやデータベースの意図せぬ外部公開 CSPM による設定不備の検出
ご協力いただいたコントリビューター様
None