Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
監視運用の省人化と高レジリエンスな監視システムの提供_ShowNet2021 studio 2...
Search
ShowNet
PRO
July 01, 2021
Technology
0
11
監視運用の省人化と高レジリエンスな監視システムの提供_ShowNet2021 studio 20210414
ShowNet
PRO
July 01, 2021
Tweet
Share
More Decks by ShowNet
See All by ShowNet
【ShowNet Stage 2025】ゼロトラストで支える広帯域セキュリティサービスと脅威監視基盤
shownet
PRO
0
320
【ShowNet Stage 2025】AIと既存サービスを融合したマルチテナント対応コンテナ基盤
shownet
PRO
0
190
【ShowNet Stage 2025】堅固にコラボレーションするShowNetのExternal
shownet
PRO
0
150
【ShowNet Stage 2025】物理層の世界へようこそ、進化し続けるファシリティの構築
shownet
PRO
0
300
【ShowNet Stage 2025】ShowNetが創造したバックボーンネットワークの近未来
shownet
PRO
0
180
【ShowNet Stage 2025】ShowNet初!キャリア5G連携への挑戦
shownet
PRO
0
160
【ShowNet Stage 2025】ShowNet Media-X ~つながる・ひろがる日本のメディアネットワーク~
shownet
PRO
0
230
【ShowNet Stage 2025】AI基盤からエッジまで、多様化するネットワークとテストの進化
shownet
PRO
0
970
【ShowNet Stage 2025】ShowNetが考える"未来の光伝送"
shownet
PRO
0
190
Other Decks in Technology
See All in Technology
KotlinConf 2025_イベントレポート
sony
1
140
Claude Code でアプリ開発をオートパイロットにするためのTips集 Zennの場合 / Claude Code Tips in Zenn
wadayusuke
5
1.9k
「どこから読む?」コードとカルチャーに最速で馴染むための実践ガイド
zozotech
PRO
0
570
Apache Spark もくもく会
taka_aki
0
140
dbt開発 with Claude Codeのためのガードレール設計
10xinc
2
1.3k
[ JAWS-UG 東京 CommunityBuilders Night #2 ]SlackとAmazon Q Developerで 運用効率化を模索する
sh_fk2
3
460
LLM時代のパフォーマンスチューニング:MongoDB運用で試したコンテキスト活用の工夫
ishikawa_pro
0
170
LLMを搭載したプロダクトの品質保証の模索と学び
qa
1
1.1k
テストを軸にした生き残り術
kworkdev
PRO
0
220
未経験者・初心者に贈る!40分でわかるAndroidアプリ開発の今と大事なポイント
operando
6
750
AI時代を生き抜くエンジニアキャリアの築き方 (AI-Native 時代、エンジニアという道は 「最大の挑戦の場」となる) / Building an Engineering Career to Thrive in the Age of AI (In the AI-Native Era, the Path of Engineering Becomes the Ultimate Arena of Challenge)
jeongjaesoon
0
260
Aurora DSQLはサーバーレスアーキテクチャの常識を変えるのか
iwatatomoya
1
1.2k
Featured
See All Featured
Side Projects
sachag
455
43k
The MySQL Ecosystem @ GitHub 2015
samlambert
251
13k
jQuery: Nuts, Bolts and Bling
dougneiner
64
7.9k
Save Time (by Creating Custom Rails Generators)
garrettdimon
PRO
32
1.6k
Product Roadmaps are Hard
iamctodd
PRO
54
11k
Visualization
eitanlees
148
16k
Statistics for Hackers
jakevdp
799
220k
個人開発の失敗を避けるイケてる考え方 / tips for indie hackers
panda_program
113
20k
Why You Should Never Use an ORM
jnunemaker
PRO
59
9.5k
Understanding Cognitive Biases in Performance Measurement
bluesmoon
29
1.9k
Chrome DevTools: State of the Union 2024 - Debugging React & Beyond
addyosmani
7
850
Fantastic passwords and where to find them - at NoRuKo
philnash
52
3.4k
Transcript
ShowNet2021 監視運用の省人化と 高レジリエンスな監視環境の提供
モニタリングコンセプト 監視運用の省人化と高レジリエンスな監視システムの提供
過去からの継続 監視運用の省人化と高レジリエンスな監視システムの提供 • 統合監視(SNMPを用いた全体監視) • ログ監視・xFlow監視 • syslog/xFlow/snmpトラップ転送 • 時刻ずれ監視
• パケット解析・可視化 • 仮想化基盤監視 • 各種監視サービスの連携
2019年からのトライ(2021年も継続) 監視運用の省人化と高レジリエンスな監視システムの提供 • アプリケーション品質監視 • 特定アプリケーションのボトルネック可視化・通知 • クラウドサービス型監視 • エージェント型監視サービスの普及
• アラートの一元化 • クラウドサービスへのアラート集約 • 継続的な通信計測による経路可視化 • ShowNet内外からのアクティブ監視による通信経路の可視化
監視運用の省人化と高レジリエンスな監視システムの提供 監視要件の変化 1. DCの構築 2. ネットワークの構築 3. サーバ・ストレージ基盤の構築 4. セキュリティサービスの構築
5. アプリケーションの安定稼働 6. プロバイダサービスの提供 プロバイダのサービスを 2週間で構築し提供 監視要件も都度変化する
変化する監視要件に追従するシステム設計 監視運用の省人化と高レジリエンスな監視システムの提供 • Hotstages前期(4/3〜4/4) • 温湿度監視、機器への死活監視、syslog受信監視 • Hotstage後期(4/5〜4/8) • 機器の設定監視、特定ログ/キーワード監視
• Deploy Day(4/8〜6/9) • Pod監視、syslog監視、xFlow監視、品質監視 • Interop Tokyo Day1〜3(4/14〜4/16) • 安定稼働のための監視 ※4/2は主に機器マウント
監視対象:トポロジに乗る全ての機器 監視運用の省人化と高レジリエンスな監視システムの提供
ターゲット数 監視運用の省人化と高レジリエンスな監視システムの提供 • 監視ターゲット • 機器総数:455(ネットワーク機器、仮想アプライアンス含む) • 監視項目 • 死活監視
• トラヒック監視 • 温湿度監視 • システムリソース監視 • ログ/xFlow/trap監視
2021年ログ総数 クラウドサービスとオンプレミス監視システムの融合 日付 ログ行数 4/5 794,469 4/6 16,401,930 4/7 18,411,243
4/8 50,507,812 4/9 170,417,324 4/10 208,446,505 4/11 183,080,233 日付 ログ行数 4/12 203,690,056 4/13 147,575,948 4/14 166,367,253 ログ行数:LogInsightでの日別暫定集計値 ※約 2000 messages/sec
2021年のShowNet監視 監視運用の省人化と高レジリエンスな監視システムの提供
クラウドサービス モニタリング機器
ShowNet2021 モニタリングコンセプト 監視運用の省人化と高レジリエンスな監視システムの提供 • 監視運用の省人化と高レジリエンスな監視システムの提供 オンプレミスShowNet環境 テレメトリ トラフィック分析 ログ解析 時刻監視
統合監視基盤 Cloud型監視 -環境非依存な監視システム アラート集約管理 -重複排除 -アラートの最適な分類 -多種多様な通知手法の提供 -詳細通信解析 -リアルタイム分析 -アノマリ検知 -即時性の高いログ検索 -ログの集約管理 -経路監視 -Flow監視 - 時刻同期監視 -機器リソース監視 -死活監視 監視アラートの通知 オペレータへの通知
ログ監視・可視化・高速検索 監視運用の省人化と高レジリエンスな監視システムの提供 ダッシュボード インタラクティブ分析
zabbix- proxy1 oracle zabbix- proxy2 監視運用の省人化と高レジリエンスな監視システムの提供 • 分散監視システムによるマルチクラウド・ハイブリッド クラウドのモニタリング System
AnswerG3 System Answer XC System Answer- pub Azure GCP zabbix-2 zabbix- proxy3 ECL2.0 Dynatrace ThousandEyes zabbix-1 ShowNet Azure監視 クラウド間監視 server server server server agentless agentbase クラウドからの監視 activegate serverserver
統合監視 監視運用の省人化と高レジリエンスな監視システムの提供
時刻監視 監視運用の省人化と高レジリエンスな監視システムの提供 ・・・ 時刻同期
データセンターインフラ管理 監視運用の省人化と高レジリエンスな監視システムの提供
xFlow監視 監視運用の省人化と高レジリエンスな監視システムの提供
サブテーマ 監視運用の省人化と高レジリエンスな監視システムの提供 • テレメトリを用いたトラフィック分析・アノマリ検知に よる運用の高度化 FlowInspector-10g Apresia22000- 24X2C8X-BR Vision X
MirrorTrrafic asr9904 FlowInspector-100g トラフィック詳細解析 バースト検知 asr9904 paragon-insight asr9902 c8201 ncs55a1 OpenConfigベース Telemetry
テレメトリ 監視運用の省人化と高レジリエンスな監視システムの提供 @flowinspector
監視運用の省人化と高レジリエンスな監視システムの提供 • 実トラヒックを用いたリアルタイム通信解析 Vision X Flowmon Probe Flowmon Collector TAPデバイスからの
トラフィク取得 Netflow MirrorTrrafic
SaaS型監視 監視運用の省人化と高レジリエンスな監視システムの提供
監視運用の省人化と高レジリエンスな監視システムの提供 • 機械学習によるアラート監視の最適化・効率化の実現 alert alert alert alert -重複排除 -アラートの最適な分類 -多種多様な通知手法の提供
SaaSでのアラート監視 監視運用の省人化と高レジリエンスな監視システムの提供 alert alert alert alert
協力いただいたいコントリビュータさま 監視運用の省人化と高レジリエンスな監視システムの提供