Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
現状分析と予兆検知を融合した監視システムの確立 モニタリング-スタジオ
Search
ShowNet
PRO
June 16, 2022
Technology
0
600
現状分析と予兆検知を融合した監視システムの確立 モニタリング-スタジオ
2022/6/15-6/17 に幕張メッセで開催されたInterop Tokyo 2022のShowNetスタジオでの講演資料です。
ShowNet
PRO
June 16, 2022
Tweet
Share
More Decks by ShowNet
See All by ShowNet
【shownet.conf_】ShowNet 2024 ~ Inter * Network ~
shownet
PRO
0
2.1k
【shownet.conf_】ShowNet伝送改めShowNet APN 2024
shownet
PRO
0
1.8k
【shownet.conf_】コンピューティング資源を統合した分散コンテナ基盤の進化
shownet
PRO
0
1.6k
【shownet.conf_】ShowNet x 宇宙ネットワーク
shownet
PRO
0
1.6k
【shownet.conf_】多様化するネットワーク環境を柔軟に統合するルーティングテクノロジー
shownet
PRO
0
1.5k
【shownet.conf_】3Dアプローチで守るセキュリティ
shownet
PRO
0
1.5k
【shownet.conf_】トポロジ図の歩き方
shownet
PRO
0
3.2k
【shownet.conf_】AI技術とUX監視の応用でShowNetの基盤を支えるモニタリングシステム
shownet
PRO
0
1.5k
【shownet.conf_】ローカル5Gを活用したウォーキングツアーの体感向上
shownet
PRO
0
1.4k
Other Decks in Technology
See All in Technology
新卒3年目の後悔〜機械学習モデルジョブの運用を頑張った話〜
kameitomohiro
0
360
ひとり情シスなCTOがLLMと始めるオペレーション最適化 / CTO's LLM-Powered Ops
yamitzky
0
320
OTFSG勉強会 / Introduction to the History of Delta Lake + Iceberg
databricksjapan
0
120
菸酒生在 LINE Taiwan 的後端雙刀流
line_developers_tw
PRO
0
1k
Prox Industries株式会社 会社紹介資料
proxindustries
0
140
Windows 11 で AWS Documentation MCP Server 接続実践/practical-aws-documentation-mcp-server-connection-on-windows-11
emiki
0
580
活きてなかったデータを活かしてみた話 / Shirokane Kougyou vol 19
sansan_randd
1
400
DB 醬,嗨!哪泥嘎斯基?
line_developers_tw
PRO
0
1.1k
Oracle Audit Vault and Database Firewall 20 概要
oracle4engineer
PRO
2
1.6k
新規プロダクト開発、AIでどう変わった? #デザインエンジニアMeetup
bengo4com
0
500
実践! AIエージェント導入記
1mono2prod
0
130
AI技術トレンド勉強会 #1MCPの基礎と実務での応用
nisei_k
1
240
Featured
See All Featured
Making the Leap to Tech Lead
cromwellryan
134
9.3k
[Rails World 2023 - Day 1 Closing Keynote] - The Magic of Rails
eileencodes
35
2.3k
The Pragmatic Product Professional
lauravandoore
35
6.7k
A Modern Web Designer's Workflow
chriscoyier
693
190k
Raft: Consensus for Rubyists
vanstee
140
7k
Statistics for Hackers
jakevdp
799
220k
Evolution of real-time – Irina Nazarova, EuRuKo, 2024
irinanazarova
8
790
Building a Modern Day E-commerce SEO Strategy
aleyda
41
7.3k
BBQ
matthewcrist
89
9.7k
Designing Experiences People Love
moore
142
24k
KATA
mclloyd
29
14k
ReactJS: Keep Simple. Everything can be a component!
pedronauck
667
120k
Transcript
現状分析と予兆検知を融合した 監視システムの確立
None
モニタリング基盤
変化する監視要件に追従するシステム設計 • Hotstages前期(6/3〜6/4) • 温湿度監視、機器への死活監視、syslog受信監視 • Hotstage後期(6/5〜6/8) • 機器の設定監視、特定ログ/キーワード監視 •
Deploy Day(6/8〜6/9) • Pod監視、syslog監視、xFlow監視、品質監視 • Interop Tokyo Day1〜3(6/15〜6/17) • 安定稼働のための監視 ※6/3は主に機器マウント
監視要件の変化 1. DCの構築 2. ネットワークの構築 3. サーバ・ストレージ基盤の構築 4. セキュリティサービスの構築 5.
アプリケーションの安定稼働 6. プロバイダサービスの提供 プロバイダのサービスを 2週間で構築し提供 監視要件も都度変化する
モニタリングコンセプト
モニタリングテーマ2022 現状分析と予兆検知を融合した監視システムの確立 • 監視データを利用した予兆検知技術の運用への応用 • ハイブリッドクラウドを活用した高可用性な監視システムの実現 • トラフィック解析技術を駆使した進化するネットワーク詳細分析技術 モニタリング
モニタリングテーマ2022 現状分析と予兆検知を融合した監視システムの確立 現状分析 xFlow,SNMP,Syslog 詳細分析 パケット解析 経路解析 フィードフォワード 障害予測 キャパシティ予測
運用オペレーション 運用サポート 運用(障害)分析 運用サポート技術 アラート・ 統計情報 仮想基盤監視 クラウド監視
監視データを利用した予兆検知技術の 運用への応用 • 「AI」「機械学習」といったキーワードを売りにした製 品をどのように運用に取り入れるか。 • 異常検知 • 急なネットワーク変化による変化のアラート検知 •
キャパシティ予測 • コンピューターリソースの使用状況 • Syslog出力量 • CPU,メモリ,ディスク容量 映像品質の異常検知 トラフィック量予測
• オンプレミス・クラウド両方からのActive-Active監視 • 監視環境が地理的配置に依存しない構成 • クラウド内のリージョンを跨いだ冗長構成 ハイブリッドクラウドを活用した高可用性な 監視システムの実現 ShowNet Zabbix-1
System AnswerG3 [1-3] Azure ManagementNetwork Backup/Restore Zabbix-3 Zabbix-2 HA System AnswerG3 [1-3] Azure SQL Database West ThousandEyes- agent System AnswerG3 [1-3] East ThousandEyes- agent ShowNet機器群 監視 監視
ShowNetオンプレミス環境 Azure Flowmon Collector Logstare FlowInspe ctor-10G Zabbix6.0 R220 Pipeline
SNMP trap Syslog sFlow NetFlow IPFIX アプリケーション間連携 System Answer XC ミラートラフィック Flowmon Probe Flowmon Collector-vm Zabbix-1 System Answer Logoption System Answer StatsOption SystemAnswer G3-[1-3] モニタリング ShowNet機器群 vRealizeNetwork Insight AX-Network- Manager FlowInspe ctor-100G EXA64100 #N-6 Rack PacketMaster EX5-[1-2] System AnswerG3 [1-3] Zabbix-3 Zabbix-2 監視トラフィックの集約・分散
トラフィック解析技術を駆使した進化する ネットワーク詳細分析技術 • リアルタイムトラフィック分析 • マイクロバースト・遅延値・品質値のリアルタイム測定 • リアルタイムlogの検索、監視、分析 • 映像トラフィックのシーケンス番号を識別し、jitter値をマイクロ秒オー
ダで測定 • データプレーントラフィックからのフロー生成・分析 • ミラートラフィックからnetflow生成
モニタリングから見るShowNetの状況 • 監視ホスト数 :514 • 最大Syslog数/days:53,975,699 • 最大フロー/sec:4000 ※SNMP監視の結果から抽出 Syslog数/日
フロー/秒
モニタリングから見るShowNetの状況②
おわりに • 監視基盤のアーキテクチャで効率的に収集 • 多種多様な監視データをあらゆるツールで運用 • 監視基盤の安定稼働のためにクラウド・オンプレミス で冗長化
協力いただいたいコントリビュータさま