Amazon Elastic Compute Cloud (Amazon EC2) で 100 GbE がリリースされたので試してみた

by Atsushi Fukushima

Slide 1

Slide 1 text

Amazon Elastic Compute Cloud (Amazon EC2) で 1 0 0 G b E がリリースされたので試してみた株式会社スカイアーチネットワークス福島厚 17th September 2019

Slide 2

Slide 2 text

⾃⼰紹介名前：福島厚所属：株式会社スカイアーチネットワークス⽣年⽉⽇：１９７２年４⽉１２⽇（⼦年の牡⽺座）家族：既婚⼦供2⼈ t w i t t e r ： @NullPointerExp

Slide 3

Slide 3 text

Motivation（動機）

Slide 4

Slide 4 text

https://youtu.be/mDNHK-SzXEM AWS re:Invent 2018 - Monday Night Live with Peter DeSantis

Slide 5

Slide 5 text

おーっすげー!!

Slide 6

Slide 6 text

がちょっと気になる

Slide 7

Slide 7 text

原著は2013年発⾏とちょっと古い

Slide 8

Slide 8 text

https://youtu.be/89fYOo1V2pA AWS re:Invent 2017: How Netflix Tunes Amazon EC2 Instances for Performance (CMP325)

Slide 9

Slide 9 text

「例えば、4チャネルのPCI Express (PCIe) Gen 2 スロットにデュアル 10 GbE ネットワークインターフェースカードが接続されていたとする。カードの最⼤帯域幅は、2 × 10 GbE = 20 Gbps、スロットの最⼤帯域幅は、4 × 4 Gbps = 16 Gbps となる。そのため、両ポートのネットワークスループットは、 PCIe Gen2 の帯域幅によって制限され、両者を同時に回線の最⾼速で動かすことはできない (私は実際の場⾯でもこれをみたことがある)。」(P.513)

Slide 10

Slide 10 text

他にボトルネックになるところは無いだろうか？

Slide 11

Slide 11 text

USE メソッド • U t i l i z a t i o n ( 使⽤率 ) • S a t u r a t i o n ( 飽和 ) • E r r o r s ( エラー ) http://www.brendangregg.com/usemethod.html

Slide 12

Slide 12 text

例えばメモリ DDR4-2666 だとすると⼤体チャンネルあたり170Gbps。 100Gbps だと半分以上を占有する。例えば CPU MTU9001だとするとざっくり150万パケット。0.67us で1パケット処理する必要がある。3GHz の CPUだと⼤体2000サイクル程度で処理する必要がある。

Slide 13

Slide 13 text

利⽤できるインスタンスタイプ

Slide 14

Slide 14 text

https://aws.amazon.com/jp/ec2/instance-types/

Slide 15

Slide 15 text

https://aws.amazon.com/jp/ec2/instance-types/

Slide 16

Slide 16 text

https://aws.amazon.com/jp/ec2/instance-types/

Slide 17

Slide 17 text

気になるお値段は？

Slide 18

Slide 18 text

★ https://aws.amazon.com/jp/ec2/pricing/on-demand/

Slide 19

Slide 19 text

⼤体１時間500円ぐらい対向で使って1時間1000円ぐらい 2−3時間の検証なら2−3000円で実施できそう

Slide 20

Slide 20 text

⼤体新橋のサウナ⼀回分それならお⼩遣いでなんとかなりそう

Slide 21

Slide 21 text

実機を買うと100万円以上の出費

Slide 22

Slide 22 text

やってみる！

Slide 23

Slide 23 text

測定環境リージョン us-west-2 (オレゴン) AZ us-west-2b (単⼀AZ) インスタンスタイプ c5n.18xlarge CPU Intel(R) Xeon(R) Platinum 8124M CPU @ 3.00GHz OS Amazon Linux 2 測定ツール iperf 3 MTU 9001 (OS デフォルト)

Slide 24

Slide 24 text

1プロセスで-Pオプションで多重化 1 - 2 0 ストリームを測定

Slide 25

Slide 25 text

0 5 10 15 20 25 30 1 2 3 4 5 6 7 8 9 10 送信受信

Slide 26

Slide 26 text

⼤体６ストリーム・25Gbps 付近で頭打ちになる

Slide 27

Slide 27 text

性能情報を確認してみると

Slide 28

Slide 28 text

0 20 40 60 80 100 120 2019-09-12 05:37:13 UTC 2019-09-12 05:37:14 UTC 2019-09-12 05:37:15 UTC 2019-09-12 05:37:16 UTC 2019-09-12 05:37:17 UTC 2019-09-12 05:37:18 UTC 2019-09-12 05:37:19 UTC 2019-09-12 05:37:20 UTC 2019-09-12 05:37:21 UTC 2019-09-12 05:37:22 UTC 2019-09-12 05:37:13 UTC 2019-09-12 05:37:14 UTC 2019-09-12 05:37:15 UTC 2019-09-12 05:37:16 UTC 2019-09-12 05:37:17 UTC 2019-09-12 05:37:18 UTC 2019-09-12 05:37:19 UTC 2019-09-12 05:37:20 UTC 2019-09-12 05:37:21 UTC 2019-09-12 05:37:22 UTC 2019-09-12 05:37:13 UTC 2019-09-12 05:37:14 UTC 2019-09-12 05:37:15 UTC 2019-09-12 05:37:16 UTC 2019-09-12 05:37:17 UTC 2019-09-12 05:37:18 UTC 2019-09-12 05:37:19 UTC 2019-09-12 05:37:20 UTC 2019-09-12 05:37:21 UTC 2019-09-12 05:37:22 UTC 2019-09-12 05:37:13 UTC 2019-09-12 05:37:14 UTC 2019-09-12 05:37:15 UTC 2019-09-12 05:37:16 UTC 2019-09-12 05:37:17 UTC 2019-09-12 05:37:18 UTC 2019-09-12 05:37:19 UTC 2019-09-12 05:37:20 UTC 2019-09-12 05:37:21 UTC 2019-09-12 05:37:22 UTC 2019-09-12 05:37:13 UTC 2019-09-12 05:37:14 UTC 2019-09-12 05:37:15 UTC 2019-09-12 05:37:16 UTC 2019-09-12 05:37:17 UTC 2019-09-12 05:37:18 UTC 2019-09-12 05:37:19 UTC 2019-09-12 05:37:20 UTC 2019-09-12 05:37:21 UTC 2019-09-12 05:37:22 UTC 2019-09-12 05:37:13 UTC 2019-09-12 05:37:14 UTC 2019-09-12 05:37:15 UTC 2019-09-12 05:37:16 UTC 2019-09-12 05:37:17 UTC 2019-09-12 05:37:18 UTC 2019-09-12 05:37:19 UTC 2019-09-12 05:37:20 UTC 2019-09-12 05:37:21 UTC 2019-09-12 05:37:22 UTC %idle %iowait %nice %steal %system %user all cpu0 cpu1 cpu10 cpu11 cpu12 cpu13 cpu14 cpu15 cpu16 cpu17 cpu18 cpu19 cpu2 cpu20 cpu21 cpu22 cpu23 cpu24 cpu25 cpu26 cpu27

Slide 29

Slide 29 text

特定CPUで%System が 100%になっていることが確認できた。 C P U の性能限界と思われる。

Slide 30

Slide 30 text

そもそも iperf3 は単⼀プロセス/スレッドで多重化しているので処理が特定 CPU に偏る。

Slide 31

Slide 31 text

仕⽅がないので複数プロセスを利⽤することにした。各プロセス１ストリームとして３０プロセス３０ストリームまで測定

Slide 32

Slide 32 text

/proc/interruputを⾒るとRSSが有効になっている様に⾒受けられるので、複数プロセッサでの処理が恐らく効果的なはず ※ Accelerated RSSやData Direct I/Oなど他の⾼速化テクノロジが有効かは不明

Slide 33

Slide 33 text

キャッシュの有効利⽤という観点からもL1/L2 キャッシュがコア毎にあるので、プロセッサ単位に分割した⽅が有利

Slide 34

Slide 34 text

No content

Slide 35

Slide 35 text

0 20 40 60 80 100 120 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 e35329ba 87e4a23c 93b64963

Slide 36

Slide 36 text

出るときはほぼ１００Gbps 出るが⼤体２０プロセス程度で頭打ちになり80−１００Gbps の間で値がばらける。

Slide 37

Slide 37 text

おそらくウィンドウスケールや流量調整・輻輳制御などの関係でTCPが帯域を使い切らないように程よく調整しているためと思われる。また各ソケットが協調して輻輳制御しているわけではないのでそれぞれが個別に計算した結果⼀⻫に流量調整すると全体としてのスループットが下がる可能性がある。

Slide 38

Slide 38 text

厳密にはパケットキャプチャを採取して確認する必要があるが、毎秒10GB/約150万パケットを確認するのはちょっと⾟い

Slide 39

Slide 39 text

Placement Group

Slide 40

Slide 40 text

• クラスタープレイスメントグループ • 低レイテンシ • 同⼀AZ内に配置 • シングルフローで 10 Gbps • 2つのインスタンス間の通信の最⼤速度は遅い⽅の速度になる。 • パーティションプレイスメントグループ • 異なるパーティションに配置 • 耐障害性の向上 • スプレッドプレイスメントグループ • 異なるラックに配置 • 耐障害性の向上 https://docs.aws.amazon.com/AWSEC2/latest/WindowsGuide/placement-groups.html

Slide 41

Slide 41 text

Slide 42

Slide 42 text

0 10 20 30 40 50 60 70 80 90 100 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 766cd482 14b0fd5f 0940f98e

Slide 43

Slide 43 text

今回の様に連続してバースト転送する様なユースケースでは低レイテンシのメリットがあまり⾒受けらなかった。

Slide 44

Slide 44 text

Lessons(学び)

Slide 45

Slide 45 text

• 100Gbpsの様な⾼速ネットワークを使⽤する場合はマルチプロセス、マルチスレッドを利⽤して複数のプロセッサに処理を分散する必要がある。 • TCPを複数ストリーム並列に分散する場合は、輻輳制御、流量制御によって帯域上限付近では必ずしも全開の性能が出るわけではない。場合によっては他のプロトコルの利⽤も検討する。

Slide 46

Slide 46 text

課題

Slide 47

Slide 47 text

• 搭載プロセッサ数や通信可能帯域が増えた結果、パケットキャプチャや、CPU性能の様に採取される性能データが増えているので、これまでと異なる調査⼿法、データの表現⽅法が必要と感じた。 • また、プロセッサカウンタや bcc など利⽤可能な指標およびツールが増えているのでこれらを有効に利⽤してより的確な分析ができる様にしたい。