Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
現状分析と予兆検知を融合した監視システムの確立 モニタリング-スタジオ
Search
ShowNet
PRO
June 16, 2022
Technology
0
630
現状分析と予兆検知を融合した監視システムの確立 モニタリング-スタジオ
2022/6/15-6/17 に幕張メッセで開催されたInterop Tokyo 2022のShowNetスタジオでの講演資料です。
ShowNet
PRO
June 16, 2022
Tweet
Share
More Decks by ShowNet
See All by ShowNet
【ShowNet Stage 2025】ゼロトラストで支える広帯域セキュリティサービスと脅威監視基盤
shownet
PRO
0
290
【ShowNet Stage 2025】AIと既存サービスを融合したマルチテナント対応コンテナ基盤
shownet
PRO
0
170
【ShowNet Stage 2025】堅固にコラボレーションするShowNetのExternal
shownet
PRO
0
140
【ShowNet Stage 2025】物理層の世界へようこそ、進化し続けるファシリティの構築
shownet
PRO
0
280
【ShowNet Stage 2025】ShowNetが創造したバックボーンネットワークの近未来
shownet
PRO
0
160
【ShowNet Stage 2025】ShowNet初!キャリア5G連携への挑戦
shownet
PRO
0
140
【ShowNet Stage 2025】ShowNet Media-X ~つながる・ひろがる日本のメディアネットワーク~
shownet
PRO
0
200
【ShowNet Stage 2025】AI基盤からエッジまで、多様化するネットワークとテストの進化
shownet
PRO
0
940
【ShowNet Stage 2025】ShowNetが考える"未来の光伝送"
shownet
PRO
0
170
Other Decks in Technology
See All in Technology
【 LLMエンジニアがヒューマノイド開発に挑んでみた 】 - 第104回 Machine Learning 15minutes! Hybrid
soneo1127
0
280
落ちる 落ちるよ サーバーは落ちる
suehiromasatoshi
0
120
AI時代にPdMとPMMはどう連携すべきか / PdM–PMM-collaboration-in-AI-era
rakus_dev
0
270
【Grafana Meetup Japan #6】Grafanaをリバプロ配下で動かすときにやること ~ Grafana Liveってなんだ ~
yoshitake945
0
230
サンドボックス技術でAI利活用を促進する
koh_naga
0
180
おやつは300円まで!の最適化を模索してみた
techtekt
PRO
0
270
ZOZOマッチのアーキテクチャと技術構成
zozotech
PRO
3
1.2k
フィンテック養成勉強会#56
finengine
0
120
AWS環境のリソース調査を Claude Code で効率化 / aws investigate with cc devio2025
masahirokawahara
2
1.2k
「魔法少女まどか☆マギカ Magia Exedra」での負荷試験の実践と学び
gree_tech
PRO
0
510
スプリントレトロスペクティブはチーム観察の宝庫? 〜チームの衝突レベルに合わせたアプローチ仮説!〜
electricsatie
1
150
なぜスクラムはこうなったのか?歴史が教えてくれたこと/Shall we explore the roots of Scrum
sanogemaru
3
750
Featured
See All Featured
The Art of Programming - Codeland 2020
erikaheidi
55
13k
Learning to Love Humans: Emotional Interface Design
aarron
273
40k
XXLCSS - How to scale CSS and keep your sanity
sugarenia
248
1.3M
The Power of CSS Pseudo Elements
geoffreycrofte
77
5.9k
How to Think Like a Performance Engineer
csswizardry
26
1.9k
Distributed Sagas: A Protocol for Coordinating Microservices
caitiem20
333
22k
The Pragmatic Product Professional
lauravandoore
36
6.8k
Build The Right Thing And Hit Your Dates
maggiecrowley
37
2.8k
Sharpening the Axe: The Primacy of Toolmaking
bcantrill
44
2.5k
Refactoring Trust on Your Teams (GOTO; Chicago 2020)
rmw
34
3.1k
The Straight Up "How To Draw Better" Workshop
denniskardys
236
140k
Rails Girls Zürich Keynote
gr2m
95
14k
Transcript
現状分析と予兆検知を融合した 監視システムの確立
None
モニタリング基盤
変化する監視要件に追従するシステム設計 • Hotstages前期(6/3〜6/4) • 温湿度監視、機器への死活監視、syslog受信監視 • Hotstage後期(6/5〜6/8) • 機器の設定監視、特定ログ/キーワード監視 •
Deploy Day(6/8〜6/9) • Pod監視、syslog監視、xFlow監視、品質監視 • Interop Tokyo Day1〜3(6/15〜6/17) • 安定稼働のための監視 ※6/3は主に機器マウント
監視要件の変化 1. DCの構築 2. ネットワークの構築 3. サーバ・ストレージ基盤の構築 4. セキュリティサービスの構築 5.
アプリケーションの安定稼働 6. プロバイダサービスの提供 プロバイダのサービスを 2週間で構築し提供 監視要件も都度変化する
モニタリングコンセプト
モニタリングテーマ2022 現状分析と予兆検知を融合した監視システムの確立 • 監視データを利用した予兆検知技術の運用への応用 • ハイブリッドクラウドを活用した高可用性な監視システムの実現 • トラフィック解析技術を駆使した進化するネットワーク詳細分析技術 モニタリング
モニタリングテーマ2022 現状分析と予兆検知を融合した監視システムの確立 現状分析 xFlow,SNMP,Syslog 詳細分析 パケット解析 経路解析 フィードフォワード 障害予測 キャパシティ予測
運用オペレーション 運用サポート 運用(障害)分析 運用サポート技術 アラート・ 統計情報 仮想基盤監視 クラウド監視
監視データを利用した予兆検知技術の 運用への応用 • 「AI」「機械学習」といったキーワードを売りにした製 品をどのように運用に取り入れるか。 • 異常検知 • 急なネットワーク変化による変化のアラート検知 •
キャパシティ予測 • コンピューターリソースの使用状況 • Syslog出力量 • CPU,メモリ,ディスク容量 映像品質の異常検知 トラフィック量予測
• オンプレミス・クラウド両方からのActive-Active監視 • 監視環境が地理的配置に依存しない構成 • クラウド内のリージョンを跨いだ冗長構成 ハイブリッドクラウドを活用した高可用性な 監視システムの実現 ShowNet Zabbix-1
System AnswerG3 [1-3] Azure ManagementNetwork Backup/Restore Zabbix-3 Zabbix-2 HA System AnswerG3 [1-3] Azure SQL Database West ThousandEyes- agent System AnswerG3 [1-3] East ThousandEyes- agent ShowNet機器群 監視 監視
ShowNetオンプレミス環境 Azure Flowmon Collector Logstare FlowInspe ctor-10G Zabbix6.0 R220 Pipeline
SNMP trap Syslog sFlow NetFlow IPFIX アプリケーション間連携 System Answer XC ミラートラフィック Flowmon Probe Flowmon Collector-vm Zabbix-1 System Answer Logoption System Answer StatsOption SystemAnswer G3-[1-3] モニタリング ShowNet機器群 vRealizeNetwork Insight AX-Network- Manager FlowInspe ctor-100G EXA64100 #N-6 Rack PacketMaster EX5-[1-2] System AnswerG3 [1-3] Zabbix-3 Zabbix-2 監視トラフィックの集約・分散
トラフィック解析技術を駆使した進化する ネットワーク詳細分析技術 • リアルタイムトラフィック分析 • マイクロバースト・遅延値・品質値のリアルタイム測定 • リアルタイムlogの検索、監視、分析 • 映像トラフィックのシーケンス番号を識別し、jitter値をマイクロ秒オー
ダで測定 • データプレーントラフィックからのフロー生成・分析 • ミラートラフィックからnetflow生成
モニタリングから見るShowNetの状況 • 監視ホスト数 :514 • 最大Syslog数/days:53,975,699 • 最大フロー/sec:4000 ※SNMP監視の結果から抽出 Syslog数/日
フロー/秒
モニタリングから見るShowNetの状況②
おわりに • 監視基盤のアーキテクチャで効率的に収集 • 多種多様な監視データをあらゆるツールで運用 • 監視基盤の安定稼働のためにクラウド・オンプレミス で冗長化
協力いただいたいコントリビュータさま