Rook-Cephでいろいろベンチとってみる

でいろいろベンチとってみる Takuya Utsunomiya Storage Solution Architect, Red Hat K.K.

apiVersion: apiextentions.k8s.io/v1beta1 kind: CustomResourceDefinition metadata: name: 宇都宮卓也 spec: group:
レッドハット株式会社 role: ストレージソリューションアーキテクト born: 大阪 version: 38歳 favorites: technology: ストレージ hobby: [“野球好き”, “プロレス好き”,”将棋好き”] drink: [“ビール”, “ワイン”] @japan_rook Japan Rook https://rook.connpass.com/ 一部執筆してます #japanrook 2

で計測してみる

モチベーション • IO測るの楽しいから • バックエンドのストレージ直で使うのと Rook-Cephを挟むのとでどれくらい変わるかみたい • Cephの構成変えることでどれくらい変わるのか見たい • IO測るの楽しいから
◦ ほんとだよ？なんでIO計測とかするの？ 4

環境 • k8s 1.16 on AWS • 3 master +
3 worker ◦ master : m5.xlarge (4vCPU, 16Gi RAM) ◦ worker : m5.4xlarge (16vCPU, 64Gi RAM) • Rook-Cephはworkerへ • Rook 1.2.7, Ceph 14.2.8 ◦ 最新の組み合わせ 5

遊びかた • FIO 3.13 ◦ Kubestoneのﬁoを使う ◦ Fio Custom Resourceが便利
• ﬁoのPodから100GBのPVマウント(xfs)してIOかける • 4K random read, 4K random writeでIOPSとlatencyをみる • 他のFioのオプションは ----> ◦ 割と適当に… 6 [global] direct=1 size=1G ioengine=libaio overwrite=1 runtime=120 ramp_time=10 startdelay=10 time_based [rw-64] rw=randwrite directory=/tmp bs=4k iodepth=64 [rr-64] rw=randread directory=/tmp bs=4k iodepth=64 ...

何を測るか • 素のEBS(gp2) vs Rook-Ceph 3x replica RBD • Cephクラスタのosd数
◦ 3 osd vs 12 osd • レプリカ数 ◦ 3x replica RBD vs 2x replica RBD 7

補足説明 • イメージはこんな感じ ----> • gp2は1TB未満だと3,000IOPSが天井 • 事前の予想「readは互角くらい」「writeは純粋にEBSの方が3倍はやい」
9 node EBS node EBS node EBS osd osd osd RBD 3x replica EBS raw EBS(gp2)

結果 • ReadはRook-Cephの方がIOPSもlatencyも断然はやい ◦ 全osdからreadできるから3,000IOPS以上出せる • WriteはEBSの方がはやい。けど3倍もいかない。 ◦ 三重書きのオーバーヘッド ◦
とは言え負荷が高くなって天井に当たると変わらない 10 結論 : 負荷が低い時のwriteは結構違う。個人的にはreadが強いRook-Cephの方が役に立つ気がする。

補足説明 • イメージはこんな感じ ----> • 合計容量は同じになるようにする ◦ 3 osd …
600Gi x 3 ◦ 12 osd … 150Gi x 12 • 事前の予想「OSDの数が多い方がreadもwriteも圧倒的にはやいはず」 12 node EBS node EBS node EBS osd osd osd RBD node node node RBD 3x replica EBSEBSEBSEBS EBSEBSEBSEBS EBSEBSEBSEBS osd osd osd osd osd osd osd osd osd osd osd osd 3x replica

結果 • やっぱりosdが多いほうがはやい ◦ 負荷が高いほうが違いがはっきりする • osdの容量を増やすよりScale-Outする方が断然おすすめ 13 結論 :
なにはともあれosdが多い方が正義。

補足説明 • イメージはこんな感じ ----> • Cephは3x replicaが主流だけど2x replicaもできる。もちろんnodeをまたいで複製する。 •
利用可能容量は増えるけど、二重障害で data lossになるリスクがある。 • 事前の予想「readはどちらも同じくらい」「writeは2x replicaの方がはやい」 15 node node node RBD 2x replica EBSEBSEBSEBS EBSEBSEBSEBS EBSEBSEBSEBS osd osd osd osd osd osd osd osd osd osd osd osd node node node RBD 3x replica EBSEBSEBSEBS EBSEBSEBSEBS EBSEBSEBSEBS osd osd osd osd osd osd osd osd osd osd osd osd

結果 • Readは3xの方がちょっとはやい ◦ 2xの方がprimary osd偏りやすい？運ゲー？ ◦ pg数を増やせば同じくらいになる？ • Writeは2xの方がはやい
◦ さすがに二重書きの方がオーバーヘッド少ない 16 結論 : writeは結構変わる。冗長性を取るか、write速い&少ない容量消費を取るか。

まとめどうだった？ 17 • テストケースが少ないけれど大まかな傾向は見えた。 • パブリッククラウドみたいにストレージに QoSをかけられている環境では Rook-Cephは限界突破する手段になる。
• とにかくosdはたくさんあるに越したことない。 • Write intensiveな用途では2x replicaも一つの手。 • 12osdにするとなかなか4x3で分散してくれなくて困った。 TopologySpreadConstraintsサポートが待たれる。 • やっぱりIO測るのは楽しい。

Rook-Cephでいろいろベンチとってみる

Rook-Cephでいろいろベンチとってみる

Takuya Utsunomiya

More Decks by Takuya Utsunomiya

Other Decks in Technology

Featured

Transcript

でいろいろベンチとってみる Takuya Utsunomiya Storage Solution Architect, Red Hat K.K.

apiVersion: apiextentions.k8s.io/v1beta1 kind: CustomResourceDefinition metadata: name: 宇都宮卓也 spec: group:

で計測してみる

モチベーション • IO測るの楽しいから • バックエンドのストレージ直で使うのと Rook-Cephを挟むのとでどれくらい変わるかみたい • Cephの構成変えることでどれくらい変わるのか見たい • IO測るの楽しいから

環境 • k8s 1.16 on AWS • 3 master +

遊びかた • FIO 3.13 ◦ Kubestoneのﬁoを使う ◦ Fio Custom Resourceが便利

何を測るか • 素のEBS(gp2) vs Rook-Ceph 3x replica RBD • Cephクラスタのosd数

補足説明 • イメージはこんな感じ ----> • gp2は1TB未満だと3,000IOPSが天井 • 事前の予想「readは互角くらい」「writeは純粋にEBSの方が3倍はやい」

結果 • ReadはRook-Cephの方がIOPSもlatencyも断然はやい ◦ 全osdからreadできるから3,000IOPS以上出せる • WriteはEBSの方がはやい。けど3倍もいかない。 ◦ 三重書きのオーバーヘッド ◦

補足説明 • イメージはこんな感じ ----> • 合計容量は同じになるようにする ◦ 3 osd …

結果 • やっぱりosdが多いほうがはやい ◦ 負荷が高いほうが違いがはっきりする • osdの容量を増やすよりScale-Outする方が断然おすすめ 13 結論 :

補足説明 • イメージはこんな感じ ----> • Cephは3x replicaが主流だけど2x replicaもできる。もちろんnodeをまたいで複製する。 •

結果 • Readは3xの方がちょっとはやい ◦ 2xの方がprimary osd偏りやすい？運ゲー？ ◦ pg数を増やせば同じくらいになる？ • Writeは2xの方がはやい

まとめどうだった？ 17 • テストケースが少ないけれど大まかな傾向は見えた。 • パブリッククラウドみたいにストレージに QoSをかけられている環境では Rook-Cephは限界突破する手段になる。

18