Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
現状分析と予兆検知を融合した監視システムの確立 モニタリング-スタジオ
Search
ShowNet
PRO
June 16, 2022
Technology
0
680
現状分析と予兆検知を融合した監視システムの確立 モニタリング-スタジオ
2022/6/15-6/17 に幕張メッセで開催されたInterop Tokyo 2022のShowNetスタジオでの講演資料です。
ShowNet
PRO
June 16, 2022
Tweet
Share
More Decks by ShowNet
See All by ShowNet
【swonet.conf_ 2025】AI技術 x 高精度な監視データ収集で築くインテリジェントな運用・監視基盤
shownet
PRO
0
120
【swonet.conf_ 2025】ゼロトラストで支える広帯域セキュリティサービスと脅威監視基盤
shownet
PRO
0
150
【swonet.conf_ 2025】効率化と見える化で進化し続けるファシリティの構築
shownet
PRO
0
110
【swonet.conf_ 2025】ShowNet Watt Quest ~ネットワーク省電力化に向けた計測・分析~
shownet
PRO
0
110
【swonet.conf_ 2025】オープニングセッション
shownet
PRO
0
370
【swonet.conf_ 2025】ShowNet基礎知識
shownet
PRO
0
210
【swonet.conf_ 2025】ShowNet Media-X : ShowNetがつないだ放送のミライ
shownet
PRO
0
130
【swonet.conf_ 2025】AI基盤からエッジまで、多様化するネットワークとテストの進化
shownet
PRO
0
110
【swonet.conf_ 2025】SRv6 による k8s マルチテナント環境と次世代 AI ネットワーク/サービス基盤
shownet
PRO
0
150
Other Decks in Technology
See All in Technology
StrandsとNeptuneを使ってナレッジグラフを構築する
yakumo
1
130
AzureでのIaC - Bicep? Terraform? それ早く言ってよ会議
torumakabe
1
620
量子クラウドサービスの裏側 〜Deep Dive into OQTOPUS〜
oqtopus
0
150
30万人の同時アクセスに耐えたい!新サービスの盤石なリリースを支える負荷試験 / SRE Kaigi 2026
genda
4
1.4k
SREチームをどう作り、どう育てるか ― Findy横断SREのマネジメント
rvirus0817
0
360
Context Engineeringが企業で不可欠になる理由
hirosatogamo
PRO
3
680
SREのプラクティスを用いた3領域同時 マネジメントへの挑戦 〜SRE・情シス・セキュリティを統合した チーム運営術〜
coconala_engineer
2
780
外部キー制約の知っておいて欲しいこと - RDBMSを正しく使うために必要なこと / FOREIGN KEY Night
soudai
PRO
12
5.6k
【Ubie】AIを活用した広告アセット「爆速」生成事例 | AI_Ops_Community_Vol.2
yoshiki_0316
1
120
Why Organizations Fail: ノーベル経済学賞「国家はなぜ衰退するのか」から考えるアジャイル組織論
kawaguti
PRO
1
220
SREが向き合う大規模リアーキテクチャ 〜信頼性とアジリティの両立〜
zepprix
0
480
Webhook best practices for rock solid and resilient deployments
glaforge
2
310
Featured
See All Featured
How to build an LLM SEO readiness audit: a practical framework
nmsamuel
1
650
What Being in a Rock Band Can Teach Us About Real World SEO
427marketing
0
180
The Myth of the Modular Monolith - Day 2 Keynote - Rails World 2024
eileencodes
26
3.3k
Embracing the Ebb and Flow
colly
88
5k
Heart Work Chapter 1 - Part 1
lfama
PRO
5
35k
How To Speak Unicorn (iThemes Webinar)
marktimemedia
1
380
Reality Check: Gamification 10 Years Later
codingconduct
0
2k
Everyday Curiosity
cassininazir
0
130
Leveraging Curiosity to Care for An Aging Population
cassininazir
1
170
Understanding Cognitive Biases in Performance Measurement
bluesmoon
32
2.8k
Navigating Weather and Climate Data
rabernat
0
110
How to Ace a Technical Interview
jacobian
281
24k
Transcript
現状分析と予兆検知を融合した 監視システムの確立
None
モニタリング基盤
変化する監視要件に追従するシステム設計 • Hotstages前期(6/3〜6/4) • 温湿度監視、機器への死活監視、syslog受信監視 • Hotstage後期(6/5〜6/8) • 機器の設定監視、特定ログ/キーワード監視 •
Deploy Day(6/8〜6/9) • Pod監視、syslog監視、xFlow監視、品質監視 • Interop Tokyo Day1〜3(6/15〜6/17) • 安定稼働のための監視 ※6/3は主に機器マウント
監視要件の変化 1. DCの構築 2. ネットワークの構築 3. サーバ・ストレージ基盤の構築 4. セキュリティサービスの構築 5.
アプリケーションの安定稼働 6. プロバイダサービスの提供 プロバイダのサービスを 2週間で構築し提供 監視要件も都度変化する
モニタリングコンセプト
モニタリングテーマ2022 現状分析と予兆検知を融合した監視システムの確立 • 監視データを利用した予兆検知技術の運用への応用 • ハイブリッドクラウドを活用した高可用性な監視システムの実現 • トラフィック解析技術を駆使した進化するネットワーク詳細分析技術 モニタリング
モニタリングテーマ2022 現状分析と予兆検知を融合した監視システムの確立 現状分析 xFlow,SNMP,Syslog 詳細分析 パケット解析 経路解析 フィードフォワード 障害予測 キャパシティ予測
運用オペレーション 運用サポート 運用(障害)分析 運用サポート技術 アラート・ 統計情報 仮想基盤監視 クラウド監視
監視データを利用した予兆検知技術の 運用への応用 • 「AI」「機械学習」といったキーワードを売りにした製 品をどのように運用に取り入れるか。 • 異常検知 • 急なネットワーク変化による変化のアラート検知 •
キャパシティ予測 • コンピューターリソースの使用状況 • Syslog出力量 • CPU,メモリ,ディスク容量 映像品質の異常検知 トラフィック量予測
• オンプレミス・クラウド両方からのActive-Active監視 • 監視環境が地理的配置に依存しない構成 • クラウド内のリージョンを跨いだ冗長構成 ハイブリッドクラウドを活用した高可用性な 監視システムの実現 ShowNet Zabbix-1
System AnswerG3 [1-3] Azure ManagementNetwork Backup/Restore Zabbix-3 Zabbix-2 HA System AnswerG3 [1-3] Azure SQL Database West ThousandEyes- agent System AnswerG3 [1-3] East ThousandEyes- agent ShowNet機器群 監視 監視
ShowNetオンプレミス環境 Azure Flowmon Collector Logstare FlowInspe ctor-10G Zabbix6.0 R220 Pipeline
SNMP trap Syslog sFlow NetFlow IPFIX アプリケーション間連携 System Answer XC ミラートラフィック Flowmon Probe Flowmon Collector-vm Zabbix-1 System Answer Logoption System Answer StatsOption SystemAnswer G3-[1-3] モニタリング ShowNet機器群 vRealizeNetwork Insight AX-Network- Manager FlowInspe ctor-100G EXA64100 #N-6 Rack PacketMaster EX5-[1-2] System AnswerG3 [1-3] Zabbix-3 Zabbix-2 監視トラフィックの集約・分散
トラフィック解析技術を駆使した進化する ネットワーク詳細分析技術 • リアルタイムトラフィック分析 • マイクロバースト・遅延値・品質値のリアルタイム測定 • リアルタイムlogの検索、監視、分析 • 映像トラフィックのシーケンス番号を識別し、jitter値をマイクロ秒オー
ダで測定 • データプレーントラフィックからのフロー生成・分析 • ミラートラフィックからnetflow生成
モニタリングから見るShowNetの状況 • 監視ホスト数 :514 • 最大Syslog数/days:53,975,699 • 最大フロー/sec:4000 ※SNMP監視の結果から抽出 Syslog数/日
フロー/秒
モニタリングから見るShowNetの状況②
おわりに • 監視基盤のアーキテクチャで効率的に収集 • 多種多様な監視データをあらゆるツールで運用 • 監視基盤の安定稼働のためにクラウド・オンプレミス で冗長化
協力いただいたいコントリビュータさま