Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
監視運用の省人化と高レジリエンスな監視システムの提供_ShowNet2021 studio 2...
Search
ShowNet
PRO
July 01, 2021
Technology
0
7
監視運用の省人化と高レジリエンスな監視システムの提供_ShowNet2021 studio 20210414
ShowNet
PRO
July 01, 2021
Tweet
Share
More Decks by ShowNet
See All by ShowNet
【shownet.conf_】ShowNet 2024 ~ Inter * Network ~
shownet
PRO
0
770
【shownet.conf_】ShowNet伝送改めShowNet APN 2024
shownet
PRO
0
650
【shownet.conf_】コンピューティング資源を統合した分散コンテナ基盤の進化
shownet
PRO
0
610
【shownet.conf_】ShowNet x 宇宙ネットワーク
shownet
PRO
0
580
【shownet.conf_】多様化するネットワーク環境を柔軟に統合するルーティングテクノロジー
shownet
PRO
0
560
【shownet.conf_】3Dアプローチで守るセキュリティ
shownet
PRO
0
560
【shownet.conf_】トポロジ図の歩き方
shownet
PRO
0
750
【shownet.conf_】AI技術とUX監視の応用でShowNetの基盤を支えるモニタリングシステム
shownet
PRO
0
570
【shownet.conf_】ローカル5Gを活用したウォーキングツアーの体感向上
shownet
PRO
0
520
Other Decks in Technology
See All in Technology
CDCL による厳密解法を採用した MILP ソルバー
imai448
3
160
Amplify Gen2 Deep Dive / バックエンドの型をいかにしてフロントエンドへ伝えるか #TSKaigi #TSKaigiKansai #AWSAmplifyJP
tacck
PRO
0
390
Application Development WG Intro at AppDeveloperCon
salaboy
0
190
New Relicを活用したSREの最初のステップ / NRUG OKINAWA VOL.3
isaoshimizu
3
630
誰も全体を知らない ~ ロールの垣根を超えて引き上げる開発生産性 / Boosting Development Productivity Across Roles
kakehashi
1
230
ExaDB-D dbaascli で出来ること
oracle4engineer
PRO
0
3.9k
ドメインの本質を掴む / Get the essence of the domain
sinsoku
2
160
Engineer Career Talk
lycorp_recruit_jp
0
190
OCI Security サービス 概要
oracle4engineer
PRO
0
6.5k
BLADE: An Attempt to Automate Penetration Testing Using Autonomous AI Agents
bbrbbq
0
320
データプロダクトの定義からはじめる、データコントラクト駆動なデータ基盤
chanyou0311
2
330
100 名超が参加した日経グループ横断の競技型 AWS 学習イベント「Nikkei Group AWS GameDay」の紹介/mediajaws202411
nikkei_engineer_recruiting
1
170
Featured
See All Featured
The Cult of Friendly URLs
andyhume
78
6k
The Psychology of Web Performance [Beyond Tellerrand 2023]
tammyeverts
44
2.2k
The Web Performance Landscape in 2024 [PerfNow 2024]
tammyeverts
0
110
Documentation Writing (for coders)
carmenintech
65
4.4k
StorybookのUI Testing Handbookを読んだ
zakiyama
27
5.3k
A Philosophy of Restraint
colly
203
16k
Fashionably flexible responsive web design (full day workshop)
malarkey
405
65k
Done Done
chrislema
181
16k
Docker and Python
trallard
40
3.1k
Cheating the UX When There Is Nothing More to Optimize - PixelPioneers
stephaniewalter
280
13k
Refactoring Trust on Your Teams (GOTO; Chicago 2020)
rmw
31
2.7k
JavaScript: Past, Present, and Future - NDC Porto 2020
reverentgeek
47
5k
Transcript
ShowNet2021 監視運用の省人化と 高レジリエンスな監視環境の提供
モニタリングコンセプト 監視運用の省人化と高レジリエンスな監視システムの提供
過去からの継続 監視運用の省人化と高レジリエンスな監視システムの提供 • 統合監視(SNMPを用いた全体監視) • ログ監視・xFlow監視 • syslog/xFlow/snmpトラップ転送 • 時刻ずれ監視
• パケット解析・可視化 • 仮想化基盤監視 • 各種監視サービスの連携
2019年からのトライ(2021年も継続) 監視運用の省人化と高レジリエンスな監視システムの提供 • アプリケーション品質監視 • 特定アプリケーションのボトルネック可視化・通知 • クラウドサービス型監視 • エージェント型監視サービスの普及
• アラートの一元化 • クラウドサービスへのアラート集約 • 継続的な通信計測による経路可視化 • ShowNet内外からのアクティブ監視による通信経路の可視化
監視運用の省人化と高レジリエンスな監視システムの提供 監視要件の変化 1. DCの構築 2. ネットワークの構築 3. サーバ・ストレージ基盤の構築 4. セキュリティサービスの構築
5. アプリケーションの安定稼働 6. プロバイダサービスの提供 プロバイダのサービスを 2週間で構築し提供 監視要件も都度変化する
変化する監視要件に追従するシステム設計 監視運用の省人化と高レジリエンスな監視システムの提供 • Hotstages前期(4/3〜4/4) • 温湿度監視、機器への死活監視、syslog受信監視 • Hotstage後期(4/5〜4/8) • 機器の設定監視、特定ログ/キーワード監視
• Deploy Day(4/8〜6/9) • Pod監視、syslog監視、xFlow監視、品質監視 • Interop Tokyo Day1〜3(4/14〜4/16) • 安定稼働のための監視 ※4/2は主に機器マウント
監視対象:トポロジに乗る全ての機器 監視運用の省人化と高レジリエンスな監視システムの提供
ターゲット数 監視運用の省人化と高レジリエンスな監視システムの提供 • 監視ターゲット • 機器総数:455(ネットワーク機器、仮想アプライアンス含む) • 監視項目 • 死活監視
• トラヒック監視 • 温湿度監視 • システムリソース監視 • ログ/xFlow/trap監視
2021年ログ総数 クラウドサービスとオンプレミス監視システムの融合 日付 ログ行数 4/5 794,469 4/6 16,401,930 4/7 18,411,243
4/8 50,507,812 4/9 170,417,324 4/10 208,446,505 4/11 183,080,233 日付 ログ行数 4/12 203,690,056 4/13 147,575,948 4/14 166,367,253 ログ行数:LogInsightでの日別暫定集計値 ※約 2000 messages/sec
2021年のShowNet監視 監視運用の省人化と高レジリエンスな監視システムの提供
クラウドサービス モニタリング機器
ShowNet2021 モニタリングコンセプト 監視運用の省人化と高レジリエンスな監視システムの提供 • 監視運用の省人化と高レジリエンスな監視システムの提供 オンプレミスShowNet環境 テレメトリ トラフィック分析 ログ解析 時刻監視
統合監視基盤 Cloud型監視 -環境非依存な監視システム アラート集約管理 -重複排除 -アラートの最適な分類 -多種多様な通知手法の提供 -詳細通信解析 -リアルタイム分析 -アノマリ検知 -即時性の高いログ検索 -ログの集約管理 -経路監視 -Flow監視 - 時刻同期監視 -機器リソース監視 -死活監視 監視アラートの通知 オペレータへの通知
ログ監視・可視化・高速検索 監視運用の省人化と高レジリエンスな監視システムの提供 ダッシュボード インタラクティブ分析
zabbix- proxy1 oracle zabbix- proxy2 監視運用の省人化と高レジリエンスな監視システムの提供 • 分散監視システムによるマルチクラウド・ハイブリッド クラウドのモニタリング System
AnswerG3 System Answer XC System Answer- pub Azure GCP zabbix-2 zabbix- proxy3 ECL2.0 Dynatrace ThousandEyes zabbix-1 ShowNet Azure監視 クラウド間監視 server server server server agentless agentbase クラウドからの監視 activegate serverserver
統合監視 監視運用の省人化と高レジリエンスな監視システムの提供
時刻監視 監視運用の省人化と高レジリエンスな監視システムの提供 ・・・ 時刻同期
データセンターインフラ管理 監視運用の省人化と高レジリエンスな監視システムの提供
xFlow監視 監視運用の省人化と高レジリエンスな監視システムの提供
サブテーマ 監視運用の省人化と高レジリエンスな監視システムの提供 • テレメトリを用いたトラフィック分析・アノマリ検知に よる運用の高度化 FlowInspector-10g Apresia22000- 24X2C8X-BR Vision X
MirrorTrrafic asr9904 FlowInspector-100g トラフィック詳細解析 バースト検知 asr9904 paragon-insight asr9902 c8201 ncs55a1 OpenConfigベース Telemetry
テレメトリ 監視運用の省人化と高レジリエンスな監視システムの提供 @flowinspector
監視運用の省人化と高レジリエンスな監視システムの提供 • 実トラヒックを用いたリアルタイム通信解析 Vision X Flowmon Probe Flowmon Collector TAPデバイスからの
トラフィク取得 Netflow MirrorTrrafic
SaaS型監視 監視運用の省人化と高レジリエンスな監視システムの提供
監視運用の省人化と高レジリエンスな監視システムの提供 • 機械学習によるアラート監視の最適化・効率化の実現 alert alert alert alert -重複排除 -アラートの最適な分類 -多種多様な通知手法の提供
SaaSでのアラート監視 監視運用の省人化と高レジリエンスな監視システムの提供 alert alert alert alert
協力いただいたいコントリビュータさま 監視運用の省人化と高レジリエンスな監視システムの提供