Upgrade to PRO for Only $50/Year—Limited-Time Offer! 🔥
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
ネットワーク性能調査ちょっとやってみる
Search
khwarizmi
December 20, 2018
Technology
0
240
ネットワーク性能調査ちょっとやってみる
khwarizmi
December 20, 2018
Tweet
Share
More Decks by khwarizmi
See All by khwarizmi
IntelNIC 送受信を学ぶ
khwarizmi
3
980
NICのデバドラ開発
khwarizmi
0
190
ハードウェア乱数を用いた謝辞代表者の決定
khwarizmi
0
100
僕はDPDKをやっている人ではありません(XDP・netmap入門)
khwarizmi
1
820
klab インターン成果物発表
khwarizmi
0
330
Z4「高速なFW/IDSの実装」
khwarizmi
0
190
HIGHSPEED PACKET IO
khwarizmi
0
120
Other Decks in Technology
See All in Technology
2025 DORA Reportから読み解く!AIが映し出す、成果を出し続ける組織の共通点 #開発生産性_findy
takabow
2
670
Digital omtanke på Internetdagarna 2025
axbom
PRO
0
140
Android Studio Otter の最新 Gemini 機能 / Latest Gemini features in Android Studio Otter
yanzm
0
490
AI 時代のデータ戦略
na0
3
620
Introduction to Sansan for Engineers / エンジニア向け会社紹介
sansan33
PRO
5
45k
20251127 BigQueryリモート関数で作る、お手軽AIバッチ実行環境
daimatz
0
330
メッセージ駆動が可能にする結合の最適化
j5ik2o
9
1.7k
Active Directory 勉強会 第 6 回目 Active Directory セキュリティについて学ぶ回
eurekaberry
10
3.4k
Dify on AWS の選択肢
ysekiy
0
110
AI開発の定着を推進するために揃えるべき前提
suguruooki
1
440
私も懇親会は苦手でした ~苦手だからこそ懇親会を楽しむ方法~ / 20251127 Masaki Okuda
shift_evolve
PRO
4
310
DGX SparkでローカルLLMをLangChainで動かした話
ruzia
0
120
Featured
See All Featured
Code Review Best Practice
trishagee
72
19k
Practical Orchestrator
shlominoach
190
11k
GitHub's CSS Performance
jonrohan
1032
470k
Done Done
chrislema
186
16k
Designing for humans not robots
tammielis
254
26k
RailsConf 2023
tenderlove
30
1.3k
How GitHub (no longer) Works
holman
316
140k
Building an army of robots
kneath
306
46k
Rails Girls Zürich Keynote
gr2m
95
14k
Visualizing Your Data: Incorporating Mongo into Loggly Infrastructure
mongodb
48
9.8k
Measuring & Analyzing Core Web Vitals
bluesmoon
9
680
Let's Do A Bunch of Simple Stuff to Make Websites Faster
chriscoyier
508
140k
Transcript
ネットワーク性能調査を ちょっとやってみる 法政大学 応用情報工学科B4 河原颯太(khwarizmi)
自己紹介 - 河原颯太(かわはらそうた) @khwarizmi6514 - 法政大学応用情報工学科 学部4年 金井(ネットワークセキュリティ)研究室所属 - 小学5年から野球を初めて高校3年までやっていた.
- 春日部高校出身です! (これを言うといろんなところで先輩後輩が釣れることに最近 気が付いた) - パソコンとは無縁の生活だったが, 大学入学時, 気が付いたらパソコンをやらなけ ればいけなくなっていた. - 一緒に研究をしてくれる後輩募集中 (一人で研究をしていて寂しい)
最近やってること - DPDKを用いたネットワークスタック開発 - NICのデバドラ開発 - NICのハードウェア機能活用による性能比較調査 *最近やりたいこと* - FreeBSDで性能調査(ネットワークスタック参照したりしときながら触ったことがな
い) - XDP(Internet week での lineの金丸さんのLTが熱かった) - 自作キーボード(おととい自作キットをポチった) - FPGA(購入してLEDチカチカまでしてそのままタンスの奥にいる)
話に入る前に ちょうど24時間前くらいに決まったほぼ飛び入りLTなので ぜひ 期待値0で 聞いてください
今日の話題 つい最近からやっている NICのハードウェア機能活用による性能比較調査 の現在の進捗を発表します.
近年の High speed network 事情 - ハードウェア性能が向上し, ワイヤーレートが非常に伸びている - ネックがハードからソフト的な場所に移っている
⬇ - ソフト的なネックを排除したい - 余っているハードウェアパワーを有効に使いたい
近年の High speed network 事情 - ハードウェア性能が向上し, ワイヤーレートが非常に伸びている - ネックがハードからソフトに近い場所に移っている
⬇ - ソフト的なネックを排除したい - 余っているハードウェアパワーを有効に使いたい
今日の話題となる手法 - RSS (と RPS) - チェックサムオフローディング - LRO (と
GRO)
RSS (とRPS) マルチコア環境における問題 - パケット受信のソフト割り込みは1つのCPUに偏ってしまう. - 家庭用PCでもマルチコアが普通の環境出コア数で性能がスケールしないのは非 常によろしくない - 単純に適当にパケットを順番に各コアに割り振るのでは多くの無視できない問題が
ある.
RSS (とRPS) RSSとは - Receive Side Scalingの略 - パケットをマルチコアで処理する手法 -
マルチキューNICでのみ使用可能 RPSとは - RSSのソフトウェア実装
RSS (とRPS) 仕組み - パケットヘッダの一部でハッシュ計算をし, ハッシュ値からキューを選択 - 各コアに各キューが割り振られる(と思ってほとんど構わない) - 担当のキューにパケットが来たら各コアが処理
- パケットのヘッダからハッシュを取るため, 同じフローのパケットが分散されることが ない
RSS (とRPS) 計測結果 RSS スループット (Gbps) 有効 9.43 無効 5.08
RSS (とRPS) ソフト割り込みの様子 ← 前 後→ (ちょっと怪しい...)
チェックサムオフローディング - IP, TCP, UDPのチェックサムをNICが計算してくれるやつ - こういう決まりきった計算はハードウェアの方が得意だという風に誰かが言っていま した - 基本的にはCPU使用率を下げる効果がある
チェックサムオフローディング 計測結果 checksum offloading スループット (Gbps) CPU使用率 (%) 有効 9.36
96.2 無効 9.29 99.3
LRO と GRO 割り込み事情 - 割り込みはとにかく重い(コンテキストスイッチ, キャッシュ汚染) - GbEでショートパケット(64byte)とすると, 1000000000(bit)
÷ 8(byte) ÷ 64(パケット) = 1953125 つまり, 秒間約200万回の割り込みが発生している - さすがに多すぎるでしょ
LRO と GRO LROとは - Lerge Receive Offload の略 -
分割されたTCPパケットをNICでリアセンブルする - 割り込みを削減できる GROとは - General Receive Offload の略 - LRO のソフトウェア実装
LRO と GRO 計測結果 GRO スループット (Gbps) CPU使用率 (%) 有効
9.41 10.3 無効 5.08 100
まとめ うまくNICを使ってちゃんとチューニングをすれば linuxネットワークスタックでも10G出せます