Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
【ShowNet Stage】AI技術とUX監視の応用でShowNetの基盤を支えるモニタリン...
Search
ShowNet
PRO
June 12, 2024
Technology
0
20
【ShowNet Stage】AI技術とUX監視の応用でShowNetの基盤を支えるモニタリングシステム
2024年6月に幕張メッセで実施されたInterop Tokyo ShowNetブース内ステージでのNOCチームメンバーによる講演資料
ShowNet
PRO
June 12, 2024
Tweet
Share
More Decks by ShowNet
See All by ShowNet
【shownet.conf_】ShowNet 2024 ~ Inter * Network ~
shownet
PRO
0
950
【shownet.conf_】ShowNet伝送改めShowNet APN 2024
shownet
PRO
0
800
【shownet.conf_】コンピューティング資源を統合した分散コンテナ基盤の進化
shownet
PRO
0
760
【shownet.conf_】ShowNet x 宇宙ネットワーク
shownet
PRO
0
720
【shownet.conf_】多様化するネットワーク環境を柔軟に統合するルーティングテクノロジー
shownet
PRO
0
700
【shownet.conf_】3Dアプローチで守るセキュリティ
shownet
PRO
0
700
【shownet.conf_】トポロジ図の歩き方
shownet
PRO
0
940
【shownet.conf_】AI技術とUX監視の応用でShowNetの基盤を支えるモニタリングシステム
shownet
PRO
0
700
【shownet.conf_】ローカル5Gを活用したウォーキングツアーの体感向上
shownet
PRO
0
650
Other Decks in Technology
See All in Technology
Jetpack Composeで始めるServer Cache State
ogaclejapan
2
170
私なりのAIのご紹介 [2024年版]
qt_luigi
1
120
開発生産性向上! 育成を「改善」と捉えるエンジニア育成戦略
shoota
2
350
DevOps視点でAWS re:invent2024の新サービス・アプデを振り返ってみた
oshanqq
0
180
watsonx.ai Dojo #5 ファインチューニングとInstructLAB
oniak3ibm
PRO
0
160
GitHub Copilot のテクニック集/GitHub Copilot Techniques
rayuron
36
13k
どちらを使う?GitHub or Azure DevOps Ver. 24H2
kkamegawa
0
770
Turing × atmaCup #18 - 1st Place Solution
hakubishin3
0
480
サービスでLLMを採用したばっかりに振り回され続けたこの一年のあれやこれや
segavvy
2
420
AWS re:Invent 2024で発表された コードを書く開発者向け機能について
maruto
0
190
宇宙ベンチャーにおける最近の情シス取り組みについて
axelmizu
0
110
2024年にチャレンジしたことを振り返るぞ
mitchan
0
140
Featured
See All Featured
Keith and Marios Guide to Fast Websites
keithpitt
410
22k
CSS Pre-Processors: Stylus, Less & Sass
bermonpainter
356
29k
Fantastic passwords and where to find them - at NoRuKo
philnash
50
2.9k
How to Think Like a Performance Engineer
csswizardry
22
1.2k
Why You Should Never Use an ORM
jnunemaker
PRO
54
9.1k
Fireside Chat
paigeccino
34
3.1k
The Cult of Friendly URLs
andyhume
78
6.1k
Visualization
eitanlees
146
15k
No one is an island. Learnings from fostering a developers community.
thoeni
19
3k
Java REST API Framework Comparison - PWX 2021
mraible
28
8.3k
Facilitating Awesome Meetings
lara
50
6.1k
Thoughts on Productivity
jonyablonski
67
4.4k
Transcript
AI技術とUX監視の応用でShowNetの 基盤を支えるモニタリングシステム ShowNet NOCチームメンバー モニタリング担当 神山卓哲
変化する監視要件に追従するシステム設計 監視要件の変化 1. DCサービス・監視網の構築 2. ネットワークの構築 3. サーバ・ストレージ基盤の構築 4. セキュリティサービスの構築
5. アプリケーションの安定稼働 6. プロバイダサービスの提供 2 プロバイダのサービスを 2週間で構築し提供 監視要件も都度変化する
変化する監視要件に追従するシステム設計 Hotstages前期(5/31〜6/2) 温湿度監視、機器への死活監視、syslog受信監視 Hotstage後期(6/3〜6/7) 機器の監視設定、特定ログ/キーワード監視 Deploy Day(6/8〜6/11) Pod監視、syslog監視、xFlow監視、品質監視 Interop Tokyo
Day1〜3(6/12〜6/14) 安定稼働のための監視 3 ※5/31は主に機器マウント
4
5 監視対象:トポロジに乗る全ての機器 モニタリング基盤
モニタリング 2024 テーマ 6 AI技術とUX監視の応用でShowNetの基盤を支える モニタリングシステム ユーザーエクスペリエンスを考慮したネットワーク分析基盤 AI技術と監視システムの融合による運用効率化の実現 衛星インターネットとメディア配信技術の詳細分析
ShowNetにおける監視の必要性 安定したインターネットサービスの提供 出展者ブース・来場者・構築メンバーへのサービスの提供 構築中の予期せぬ障害 設定ミス・配線ミスと言った人為的なトラブル 配線の整理作業で意図せず作業対象外ケーブルが抜線される 機器のバグが起因となる障害の発見 ShowNet特有の環境 データセンターとは違った厳しい環境での温湿度管理(外気からの影響を強 く受ける)
7
過去からの継続 統合監視(SNMPを用いた全体監視) ログ監視・xFlow監視 syslog/xFlow/snmpトラップ転送 時刻ずれ監視 パケット解析・可視化 仮想化基盤監視 各種監視サービスの連携 8
9 Flowmon Collector @FlowInspector 100G Zabbix7.0 SNMP trap Syslog sFlow/NetFlow/IPFIX
アプリケーション間連携 ミラートラフィック Flowmon Probe Flowmon Collector-VA System Answer Logoption System Answer StatsOption SystemAnswer G3-[1-3] Splunk AX-Network- Manager 監視トラフィック転送構成 System AnswerG3 [1-3] ZP-V700 SDPFクラウド ThousandEyesAgent ZS7700 Arbor insight S8000 PacketMaster EX5-[1-2] Arbor sightline SP7500 ZP-3700-N/P ZP-1700 Allegro 7410 BV-ntopng Netscout PFS Netscout ISNG Netscout NG1 AX-NV (AX-Sensor) AX-NV (AX-Collector) nprobe @FlowInspector controller NetPredy BOX CX監視Option Manager Apstra Flow Profitap ShowNet 機器群 ShowNet トラフィック
モニタリングで見るShowNetの今日までの状況 10 最大Syslog数/秒 • 監視ホスト数:853 • Logソース: Syslog:236 SNMP Trap:202
• 最大Syslog数/days: 249,205,490 過去1週間のSyslog受信量の推移
ユーザーエクスペリエンスを 考慮したネットワーク分析基盤
ユーザーエクスペリエンスを考慮したネットワーク分析基盤 モニタリング ICMP Ping Traceroute HTTP Request TWAMP アクティブ監視エージェントを用いたサービス監視 出展者用ネットワークの正常性確認・運用への反映
ユーザーエクスペリエンスを常時監視 地理的に離れたホストの死活監視
ユーザーエクスペリエンスを考慮したネットワーク分析基盤 モニタリング • ミラートラフィックによるユーザ通信品質可視化 複数製品でShowNet網を流れるミラートラフィックを解析 アプリケーションレベルで通信品質の可視化・分析ができる環境を構築している 可視化 分析
AI技術と監視システムの融合による 運用効率化の実現
AI技術と監視システムの融合による運用効率化の実現 モニタリング ShowNet内の機器から送信された監視データをLLM解析基盤へ送信 プロンプトから調査してほしいポイントを自然言語で問い合わせ 自然言語対応により、オペレータの学習コストを低減 結果からトラブルポイントの推定や対応策を提案 人間が見落としやすい情報まで結果を自然言語で結果を提供 @FlowInspector
100G PacketMasterE X5-[1-2] ShowNet 機器群 Syslog,SNMP Trap,xFlow LLM解析クラウド 監視トラフィックの転送 AIによる分析結果の送信 監視データ送信
Link Down箇所の調査の活用例 モニタリング 自然言語で分析したい内容を入力 SYSLOGデータを基に回答を生成
衛星インターネットと メディア配信技術の詳細分析
衛星インターネットとメディア配信技術の詳細分析 モニタリング TWAMPを用いた高精度な遅延測定 ShowNetから衛星インターネットの折り返し接続の遅延測定 ShowNetとテレビ局拠点間のメディア用インフラの遅延測定 TWANP Refrector TWANP
Refrector TWANP Sender 地上局 静止衛星 Internet x Space Summit FX2 地上経由 衛星経由 SID A uSID 車載アンテナ TWANP Sender TWANP 測定 TWANP Refrector TWANP 測定
協力いただいたコントリビュータさま 19 ※50音順