Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
監視運用の省人化と高レジリエンスな監視システムの提供_ShowNet2021 studio 20210414
Search
ShowNet
PRO
July 01, 2021
Technology
0
7
監視運用の省人化と高レジリエンスな監視システムの提供_ShowNet2021 studio 20210414
ShowNet
PRO
July 01, 2021
Tweet
Share
More Decks by ShowNet
See All by ShowNet
ShowNetの歩き方 2023
shownet
PRO
0
5
ShowNet2023 Topology
shownet
PRO
0
320
ShowNet2023 External
shownet
PRO
0
20
【shownet.conf_2023】ShowNetのネットワークを解説~最新鋭の技術で作るマルチテナントバックボーン~
shownet
PRO
0
1.4k
【shownet.conf_2023】ローカル5Gサービス提供への挑戦とその知見
shownet
PRO
0
1.4k
【shownet.conf_2023】パフォーマンス計測と詳細分析を組合わせた監視基盤の実現
shownet
PRO
0
1.4k
【shownet.conf_2023】ShowNetを守るセキュリティ〜広帯域化するネットワークを守る新たな挑戦〜
shownet
PRO
0
1.4k
【shownet.conf_2023】ShowNet を効率良く試験するために
shownet
PRO
0
1.6k
【shownet.conf_2023】ShowNet2023 伝送報告
shownet
PRO
0
1.7k
Other Decks in Technology
See All in Technology
プロンプトエンジニアリングでがんばらない-Agentic Workflow へ-近藤憲児
kenjikondobai
6
1.2k
Next.js に疲れた私は Vue3 に癒やされた
akagire
0
130
いつか使うかも貯金してたらめちゃめちゃ機能が増えてた話
riyaamemiya
0
620
ExaDB-D dbaascli で出来ること
oracle4engineer
PRO
0
2.1k
IaCジェネレーターとBedrockで詳細設計書を生成してみた
tsukasa_ishimaru
4
880
障害対応をちょっとずつよくしていくための 演習の作りかた
heleeen
1
1.6k
BPStudyの200回を中心にIT業界を振り返る。そしてこれから
haru860
3
400
【NW X Security JAWS#3】L3-4:AWS環境のIPv6移行に向けて知っておきたいこと
shotashiratori
1
620
Max out Local LLM in Challenging Environments
sashimimochi
1
100
Microsoft for Startups Founders Hub_20240429 update
daikikanemitsu
1
2.4k
競技としてのKaggle、役に立つKaggle
yu4u
6
2.3k
EM完全に理解した と思ったけど、 やっぱり何も分からなかった話 / EM Night Fukuoka #1
hirutas
0
280
Featured
See All Featured
Raft: Consensus for Rubyists
vanstee
133
6.3k
We Have a Design System, Now What?
morganepeng
44
6.8k
Exploring the Power of Turbo Streams & Action Cable | RailsConf2023
kevinliebholz
7
3.4k
Art, The Web, and Tiny UX
lynnandtonic
290
19k
Facilitating Awesome Meetings
lara
43
5.6k
実際に使うSQLの書き方 徹底解説 / pgcon21j-tutorial
soudai
123
39k
The Cult of Friendly URLs
andyhume
74
5.7k
Faster Mobile Websites
deanohume
300
30k
Scaling GitHub
holman
457
140k
GraphQLの誤解/rethinking-graphql
sonatard
55
9.3k
What the flash - Photography Introduction
edds
64
11k
Writing Fast Ruby
sferik
622
60k
Transcript
ShowNet2021 監視運用の省人化と 高レジリエンスな監視環境の提供
モニタリングコンセプト 監視運用の省人化と高レジリエンスな監視システムの提供
過去からの継続 監視運用の省人化と高レジリエンスな監視システムの提供 • 統合監視(SNMPを用いた全体監視) • ログ監視・xFlow監視 • syslog/xFlow/snmpトラップ転送 • 時刻ずれ監視
• パケット解析・可視化 • 仮想化基盤監視 • 各種監視サービスの連携
2019年からのトライ(2021年も継続) 監視運用の省人化と高レジリエンスな監視システムの提供 • アプリケーション品質監視 • 特定アプリケーションのボトルネック可視化・通知 • クラウドサービス型監視 • エージェント型監視サービスの普及
• アラートの一元化 • クラウドサービスへのアラート集約 • 継続的な通信計測による経路可視化 • ShowNet内外からのアクティブ監視による通信経路の可視化
監視運用の省人化と高レジリエンスな監視システムの提供 監視要件の変化 1. DCの構築 2. ネットワークの構築 3. サーバ・ストレージ基盤の構築 4. セキュリティサービスの構築
5. アプリケーションの安定稼働 6. プロバイダサービスの提供 プロバイダのサービスを 2週間で構築し提供 監視要件も都度変化する
変化する監視要件に追従するシステム設計 監視運用の省人化と高レジリエンスな監視システムの提供 • Hotstages前期(4/3〜4/4) • 温湿度監視、機器への死活監視、syslog受信監視 • Hotstage後期(4/5〜4/8) • 機器の設定監視、特定ログ/キーワード監視
• Deploy Day(4/8〜6/9) • Pod監視、syslog監視、xFlow監視、品質監視 • Interop Tokyo Day1〜3(4/14〜4/16) • 安定稼働のための監視 ※4/2は主に機器マウント
監視対象:トポロジに乗る全ての機器 監視運用の省人化と高レジリエンスな監視システムの提供
ターゲット数 監視運用の省人化と高レジリエンスな監視システムの提供 • 監視ターゲット • 機器総数:455(ネットワーク機器、仮想アプライアンス含む) • 監視項目 • 死活監視
• トラヒック監視 • 温湿度監視 • システムリソース監視 • ログ/xFlow/trap監視
2021年ログ総数 クラウドサービスとオンプレミス監視システムの融合 日付 ログ行数 4/5 794,469 4/6 16,401,930 4/7 18,411,243
4/8 50,507,812 4/9 170,417,324 4/10 208,446,505 4/11 183,080,233 日付 ログ行数 4/12 203,690,056 4/13 147,575,948 4/14 166,367,253 ログ行数:LogInsightでの日別暫定集計値 ※約 2000 messages/sec
2021年のShowNet監視 監視運用の省人化と高レジリエンスな監視システムの提供
クラウドサービス モニタリング機器
ShowNet2021 モニタリングコンセプト 監視運用の省人化と高レジリエンスな監視システムの提供 • 監視運用の省人化と高レジリエンスな監視システムの提供 オンプレミスShowNet環境 テレメトリ トラフィック分析 ログ解析 時刻監視
統合監視基盤 Cloud型監視 -環境非依存な監視システム アラート集約管理 -重複排除 -アラートの最適な分類 -多種多様な通知手法の提供 -詳細通信解析 -リアルタイム分析 -アノマリ検知 -即時性の高いログ検索 -ログの集約管理 -経路監視 -Flow監視 - 時刻同期監視 -機器リソース監視 -死活監視 監視アラートの通知 オペレータへの通知
ログ監視・可視化・高速検索 監視運用の省人化と高レジリエンスな監視システムの提供 ダッシュボード インタラクティブ分析
zabbix- proxy1 oracle zabbix- proxy2 監視運用の省人化と高レジリエンスな監視システムの提供 • 分散監視システムによるマルチクラウド・ハイブリッド クラウドのモニタリング System
AnswerG3 System Answer XC System Answer- pub Azure GCP zabbix-2 zabbix- proxy3 ECL2.0 Dynatrace ThousandEyes zabbix-1 ShowNet Azure監視 クラウド間監視 server server server server agentless agentbase クラウドからの監視 activegate serverserver
統合監視 監視運用の省人化と高レジリエンスな監視システムの提供
時刻監視 監視運用の省人化と高レジリエンスな監視システムの提供 ・・・ 時刻同期
データセンターインフラ管理 監視運用の省人化と高レジリエンスな監視システムの提供
xFlow監視 監視運用の省人化と高レジリエンスな監視システムの提供
サブテーマ 監視運用の省人化と高レジリエンスな監視システムの提供 • テレメトリを用いたトラフィック分析・アノマリ検知に よる運用の高度化 FlowInspector-10g Apresia22000- 24X2C8X-BR Vision X
MirrorTrrafic asr9904 FlowInspector-100g トラフィック詳細解析 バースト検知 asr9904 paragon-insight asr9902 c8201 ncs55a1 OpenConfigベース Telemetry
テレメトリ 監視運用の省人化と高レジリエンスな監視システムの提供 @flowinspector
監視運用の省人化と高レジリエンスな監視システムの提供 • 実トラヒックを用いたリアルタイム通信解析 Vision X Flowmon Probe Flowmon Collector TAPデバイスからの
トラフィク取得 Netflow MirrorTrrafic
SaaS型監視 監視運用の省人化と高レジリエンスな監視システムの提供
監視運用の省人化と高レジリエンスな監視システムの提供 • 機械学習によるアラート監視の最適化・効率化の実現 alert alert alert alert -重複排除 -アラートの最適な分類 -多種多様な通知手法の提供
SaaSでのアラート監視 監視運用の省人化と高レジリエンスな監視システムの提供 alert alert alert alert
協力いただいたいコントリビュータさま 監視運用の省人化と高レジリエンスな監視システムの提供