Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
ネットワーク性能調査ちょっとやってみる
Search
khwarizmi
December 20, 2018
Technology
0
180
ネットワーク性能調査ちょっとやってみる
khwarizmi
December 20, 2018
Tweet
Share
More Decks by khwarizmi
See All by khwarizmi
IntelNIC 送受信を学ぶ
khwarizmi
3
920
NICのデバドラ開発
khwarizmi
0
160
ハードウェア乱数を用いた謝辞代表者の決定
khwarizmi
0
69
僕はDPDKをやっている人ではありません(XDP・netmap入門)
khwarizmi
1
700
klab インターン成果物発表
khwarizmi
0
290
Z4「高速なFW/IDSの実装」
khwarizmi
0
160
HIGHSPEED PACKET IO
khwarizmi
0
95
Other Decks in Technology
See All in Technology
2週に1度のビッグバンリリースをデイリーリリース化するまでの苦悩 ~急成長するスタートアップのリアルな裏側~
kworkdev
PRO
8
5.8k
[SRE kaigi 2025] ガバメントクラウドに向けた開発と変化するSRE組織のあり方 / Development for Government Cloud and the Evolving Role of SRE Teams
kazeburo
3
1.6k
あなたの興味は信頼性?それとも生産性? SREとしてのキャリアに悩むみなさまに伝えたい選択肢
jacopen
5
2.2k
あなたはJVMの気持ちを理解できるか?
skrb
5
1.9k
SIEMによるセキュリティログの可視化と分析を通じた信頼性向上プロセスと実践
coconala_engineer
1
2.5k
一人から始めたSREチーム3年の歩み - 求められるスキルの変化とチームのあり方 - / The three-year journey of the SRE team, which started all by myself
vtryo
7
5k
Platform EngineeringがあればSREはいらない!? 新時代のSREに求められる役割とは
mshibuya
2
3.4k
Windows Server 2025 へのアップグレードではまった話
tamaiyutaro
2
240
トラブルシュートを楽しもう (wakamonog meeting 15)
recuraki
5
1.1k
2025-01-24-SRETT11-OpenTofuについてそろそろ調べてみるか
masasuzu
0
140
CNAPPから考えるAWSガバナンスの実践と最適化
nrinetcom
PRO
1
180
“自分”を大切に、フラットに。キャリアチェンジしてからの一年 三ヶ月で見えたもの。
maimyyym
0
140
Featured
See All Featured
Music & Morning Musume
bryan
46
6.3k
Building an army of robots
kneath
302
45k
Building a Modern Day E-commerce SEO Strategy
aleyda
38
7.1k
Why You Should Never Use an ORM
jnunemaker
PRO
55
9.2k
Designing for humans not robots
tammielis
250
25k
GraphQLの誤解/rethinking-graphql
sonatard
68
10k
Fashionably flexible responsive web design (full day workshop)
malarkey
406
66k
The Illustrated Children's Guide to Kubernetes
chrisshort
48
49k
Why Our Code Smells
bkeepers
PRO
335
57k
Building Better People: How to give real-time feedback that sticks.
wjessup
366
19k
Measuring & Analyzing Core Web Vitals
bluesmoon
5
210
Art, The Web, and Tiny UX
lynnandtonic
298
20k
Transcript
ネットワーク性能調査を ちょっとやってみる 法政大学 応用情報工学科B4 河原颯太(khwarizmi)
自己紹介 - 河原颯太(かわはらそうた) @khwarizmi6514 - 法政大学応用情報工学科 学部4年 金井(ネットワークセキュリティ)研究室所属 - 小学5年から野球を初めて高校3年までやっていた.
- 春日部高校出身です! (これを言うといろんなところで先輩後輩が釣れることに最近 気が付いた) - パソコンとは無縁の生活だったが, 大学入学時, 気が付いたらパソコンをやらなけ ればいけなくなっていた. - 一緒に研究をしてくれる後輩募集中 (一人で研究をしていて寂しい)
最近やってること - DPDKを用いたネットワークスタック開発 - NICのデバドラ開発 - NICのハードウェア機能活用による性能比較調査 *最近やりたいこと* - FreeBSDで性能調査(ネットワークスタック参照したりしときながら触ったことがな
い) - XDP(Internet week での lineの金丸さんのLTが熱かった) - 自作キーボード(おととい自作キットをポチった) - FPGA(購入してLEDチカチカまでしてそのままタンスの奥にいる)
話に入る前に ちょうど24時間前くらいに決まったほぼ飛び入りLTなので ぜひ 期待値0で 聞いてください
今日の話題 つい最近からやっている NICのハードウェア機能活用による性能比較調査 の現在の進捗を発表します.
近年の High speed network 事情 - ハードウェア性能が向上し, ワイヤーレートが非常に伸びている - ネックがハードからソフト的な場所に移っている
⬇ - ソフト的なネックを排除したい - 余っているハードウェアパワーを有効に使いたい
近年の High speed network 事情 - ハードウェア性能が向上し, ワイヤーレートが非常に伸びている - ネックがハードからソフトに近い場所に移っている
⬇ - ソフト的なネックを排除したい - 余っているハードウェアパワーを有効に使いたい
今日の話題となる手法 - RSS (と RPS) - チェックサムオフローディング - LRO (と
GRO)
RSS (とRPS) マルチコア環境における問題 - パケット受信のソフト割り込みは1つのCPUに偏ってしまう. - 家庭用PCでもマルチコアが普通の環境出コア数で性能がスケールしないのは非 常によろしくない - 単純に適当にパケットを順番に各コアに割り振るのでは多くの無視できない問題が
ある.
RSS (とRPS) RSSとは - Receive Side Scalingの略 - パケットをマルチコアで処理する手法 -
マルチキューNICでのみ使用可能 RPSとは - RSSのソフトウェア実装
RSS (とRPS) 仕組み - パケットヘッダの一部でハッシュ計算をし, ハッシュ値からキューを選択 - 各コアに各キューが割り振られる(と思ってほとんど構わない) - 担当のキューにパケットが来たら各コアが処理
- パケットのヘッダからハッシュを取るため, 同じフローのパケットが分散されることが ない
RSS (とRPS) 計測結果 RSS スループット (Gbps) 有効 9.43 無効 5.08
RSS (とRPS) ソフト割り込みの様子 ← 前 後→ (ちょっと怪しい...)
チェックサムオフローディング - IP, TCP, UDPのチェックサムをNICが計算してくれるやつ - こういう決まりきった計算はハードウェアの方が得意だという風に誰かが言っていま した - 基本的にはCPU使用率を下げる効果がある
チェックサムオフローディング 計測結果 checksum offloading スループット (Gbps) CPU使用率 (%) 有効 9.36
96.2 無効 9.29 99.3
LRO と GRO 割り込み事情 - 割り込みはとにかく重い(コンテキストスイッチ, キャッシュ汚染) - GbEでショートパケット(64byte)とすると, 1000000000(bit)
÷ 8(byte) ÷ 64(パケット) = 1953125 つまり, 秒間約200万回の割り込みが発生している - さすがに多すぎるでしょ
LRO と GRO LROとは - Lerge Receive Offload の略 -
分割されたTCPパケットをNICでリアセンブルする - 割り込みを削減できる GROとは - General Receive Offload の略 - LRO のソフトウェア実装
LRO と GRO 計測結果 GRO スループット (Gbps) CPU使用率 (%) 有効
9.41 10.3 無効 5.08 100
まとめ うまくNICを使ってちゃんとチューニングをすれば linuxネットワークスタックでも10G出せます