Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
現状分析と予兆検知を融合した監視システムの確立 モニタリング-スタジオ
Search
ShowNet
PRO
June 16, 2022
Technology
0
610
現状分析と予兆検知を融合した監視システムの確立 モニタリング-スタジオ
2022/6/15-6/17 に幕張メッセで開催されたInterop Tokyo 2022のShowNetスタジオでの講演資料です。
ShowNet
PRO
June 16, 2022
Tweet
Share
More Decks by ShowNet
See All by ShowNet
ShowNet 2025 トポロジー図
shownet
PRO
0
160
ShowNet 2025 エクスターナル図
shownet
PRO
0
18
ShowNetの歩き方 2025
shownet
PRO
0
27
【展示会場内説明スライド】Security_ゼロトラストで支える広帯域セキュリティサービスと脅威監視基盤 ShowNet 2025
shownet
PRO
0
840
【展示会場内説明スライド】DC・クラウド_AIと既存サービスを融合したマルチテナント対応コンテナ基盤 ShowNet 2025
shownet
PRO
0
710
【展示会場内説明スライド】ファシリティ ShowNet 2025
shownet
PRO
0
1k
【展示会場内説明スライド】mobile_ShowNet初!キャリア5G連携への挑戦 ShowNet 2025
shownet
PRO
0
740
【展示会場内説明スライド】Media over IP ShowNet Media-X ShowNet 2025
shownet
PRO
0
730
【展示会場内説明スライド】L2/L3 ShowNet 2025
shownet
PRO
0
1.2k
Other Decks in Technology
See All in Technology
伴走から自律へ: 形式知へと導くSREイネーブリングによる プロダクトチームの信頼性オーナーシップ向上 / SRE NEXT 2025
visional_engineering_and_design
3
440
Introduction to Sansan, inc / Sansan Global Development Center, Inc.
sansan33
PRO
0
2.7k
サービスを止めるな! DDoS攻撃へのスマートな備えと最前線の事例
coconala_engineer
1
140
マルチプロダクト環境におけるSREの役割 / SRE NEXT 2025 lunch session
sugamasao
1
650
ビジネス職が分析も担う事業部制組織でのデータ活用の仕組みづくり / Enabling Data Analytics in Business-Led Divisional Organizations
zaimy
1
370
公開初日に Gemini CLI を試した話や FFmpeg と組み合わせてみた話など / Gemini CLI 初学者勉強会(#AI道場)
you
PRO
0
1.2k
Deep Security Conference 2025:生成AI時代のセキュリティ監視 /dsc2025-genai-secmon
mizutani
4
2.3k
Introduction to Sansan for Engineers / エンジニア向け会社紹介
sansan33
PRO
5
39k
ポストコロナ時代の SaaS におけるコスト削減の意義
izzii
1
460
[SRE NEXT] ARR150億円_エンジニア140名_27チーム_17プロダクトから始めるSLO.pdf
satos
5
2.8k
Microsoft Defender XDRで疲弊しないためのインシデント対応
sophiakunii
1
280
インフラ寄りSREの生存戦略
sansantech
PRO
10
3.6k
Featured
See All Featured
Rails Girls Zürich Keynote
gr2m
95
14k
How to Think Like a Performance Engineer
csswizardry
25
1.7k
Rebuilding a faster, lazier Slack
samanthasiow
83
9.1k
Design and Strategy: How to Deal with People Who Don’t "Get" Design
morganepeng
130
19k
[RailsConf 2023 Opening Keynote] The Magic of Rails
eileencodes
29
9.6k
Building Flexible Design Systems
yeseniaperezcruz
328
39k
Embracing the Ebb and Flow
colly
86
4.8k
The Cost Of JavaScript in 2023
addyosmani
51
8.6k
[Rails World 2023 - Day 1 Closing Keynote] - The Magic of Rails
eileencodes
35
2.4k
GitHub's CSS Performance
jonrohan
1031
460k
Automating Front-end Workflow
addyosmani
1370
200k
Let's Do A Bunch of Simple Stuff to Make Websites Faster
chriscoyier
507
140k
Transcript
現状分析と予兆検知を融合した 監視システムの確立
None
モニタリング基盤
変化する監視要件に追従するシステム設計 • Hotstages前期(6/3〜6/4) • 温湿度監視、機器への死活監視、syslog受信監視 • Hotstage後期(6/5〜6/8) • 機器の設定監視、特定ログ/キーワード監視 •
Deploy Day(6/8〜6/9) • Pod監視、syslog監視、xFlow監視、品質監視 • Interop Tokyo Day1〜3(6/15〜6/17) • 安定稼働のための監視 ※6/3は主に機器マウント
監視要件の変化 1. DCの構築 2. ネットワークの構築 3. サーバ・ストレージ基盤の構築 4. セキュリティサービスの構築 5.
アプリケーションの安定稼働 6. プロバイダサービスの提供 プロバイダのサービスを 2週間で構築し提供 監視要件も都度変化する
モニタリングコンセプト
モニタリングテーマ2022 現状分析と予兆検知を融合した監視システムの確立 • 監視データを利用した予兆検知技術の運用への応用 • ハイブリッドクラウドを活用した高可用性な監視システムの実現 • トラフィック解析技術を駆使した進化するネットワーク詳細分析技術 モニタリング
モニタリングテーマ2022 現状分析と予兆検知を融合した監視システムの確立 現状分析 xFlow,SNMP,Syslog 詳細分析 パケット解析 経路解析 フィードフォワード 障害予測 キャパシティ予測
運用オペレーション 運用サポート 運用(障害)分析 運用サポート技術 アラート・ 統計情報 仮想基盤監視 クラウド監視
監視データを利用した予兆検知技術の 運用への応用 • 「AI」「機械学習」といったキーワードを売りにした製 品をどのように運用に取り入れるか。 • 異常検知 • 急なネットワーク変化による変化のアラート検知 •
キャパシティ予測 • コンピューターリソースの使用状況 • Syslog出力量 • CPU,メモリ,ディスク容量 映像品質の異常検知 トラフィック量予測
• オンプレミス・クラウド両方からのActive-Active監視 • 監視環境が地理的配置に依存しない構成 • クラウド内のリージョンを跨いだ冗長構成 ハイブリッドクラウドを活用した高可用性な 監視システムの実現 ShowNet Zabbix-1
System AnswerG3 [1-3] Azure ManagementNetwork Backup/Restore Zabbix-3 Zabbix-2 HA System AnswerG3 [1-3] Azure SQL Database West ThousandEyes- agent System AnswerG3 [1-3] East ThousandEyes- agent ShowNet機器群 監視 監視
ShowNetオンプレミス環境 Azure Flowmon Collector Logstare FlowInspe ctor-10G Zabbix6.0 R220 Pipeline
SNMP trap Syslog sFlow NetFlow IPFIX アプリケーション間連携 System Answer XC ミラートラフィック Flowmon Probe Flowmon Collector-vm Zabbix-1 System Answer Logoption System Answer StatsOption SystemAnswer G3-[1-3] モニタリング ShowNet機器群 vRealizeNetwork Insight AX-Network- Manager FlowInspe ctor-100G EXA64100 #N-6 Rack PacketMaster EX5-[1-2] System AnswerG3 [1-3] Zabbix-3 Zabbix-2 監視トラフィックの集約・分散
トラフィック解析技術を駆使した進化する ネットワーク詳細分析技術 • リアルタイムトラフィック分析 • マイクロバースト・遅延値・品質値のリアルタイム測定 • リアルタイムlogの検索、監視、分析 • 映像トラフィックのシーケンス番号を識別し、jitter値をマイクロ秒オー
ダで測定 • データプレーントラフィックからのフロー生成・分析 • ミラートラフィックからnetflow生成
モニタリングから見るShowNetの状況 • 監視ホスト数 :514 • 最大Syslog数/days:53,975,699 • 最大フロー/sec:4000 ※SNMP監視の結果から抽出 Syslog数/日
フロー/秒
モニタリングから見るShowNetの状況②
おわりに • 監視基盤のアーキテクチャで効率的に収集 • 多種多様な監視データをあらゆるツールで運用 • 監視基盤の安定稼働のためにクラウド・オンプレミス で冗長化
協力いただいたいコントリビュータさま