Upgrade to Pro — share decks privately, control downloads, hide ads and more …

仮想基盤サーバのリプレイスに伴うインフラ設計/rakus-meetup-20210216

 仮想基盤サーバのリプレイスに伴うインフラ設計/rakus-meetup-20210216

Satoshi Konishi

March 12, 2021
Tweet

Other Decks in Technology

Transcript

  1. #RAKUSMeetup ©2021 RAKUS Co., Ltd. ©2021 RAKUS Co., Ltd. 仮想基盤サーバのリプレイスに

    伴うインフラ設計 株式会社ラクス インフラ開発部 小西 智
  2. #RAKUSMeetup ©2021 RAKUS Co., Ltd. 小西 智(こにし さとし) 2002年に独立系の総合ITベンダーに入社、テクニカルエンジニアとして従事。 2018年にIT関連企業に入社、インフラエンジニアとして従事。

    2019年にインフラエンジニアとしてラクスに入社。 現在は、「配配メール」「クルメル」を担当するインフラ開発チームに所属し、サービス運用と継続 的な改善に取り組んでいます。 好きなこと:DIY 始めたい事:陶器作り(春から教室に通います!!) 自己紹介
  3. #RAKUSMeetup ©2021 RAKUS Co., Ltd. 事例 仮想基盤を構成するサーバのリプレイスを実施 大きく以下の2点の課題が発生していました。 • サーバの老朽化に伴いメーカのサポートが終了

    • サービス拡大に伴うリソース不足 構成としては、HCI(ハイパーコンバージドインフラ)を採用しており、 その中の数台のサーバをリプレイスすることになりました。
  4. #RAKUSMeetup ©2021 RAKUS Co., Ltd. ファシリティの設計 ~ラックの電源使用量(可用性)~ ラックAの2台のサーバ(★)をリプレイスする場合でも、 移行期間が発生するため、サーバを並行稼働させる必要がある。 ラック内の電源容量は、計画内に抑える

    設計をする。 【変更前】 ラックA ラックB サーバ #1 ★ サーバ #2 ★ サーバ #3 サーバ #4 SW #2 SW #1 サーバ サーバ #5 サーバ #6 SW #4 SW #3 【変更後】 ラックA ラックB サーバ #1 ★ サーバ #2 ★ サーバ #3 サーバ #4 SW #2 SW #1 サーバ サーバ #5 サーバ #6 SW #4 SW #3 新サーバ #1 ★ 新サーバ #2 ★ ※ラック構成図はイメージです。
  5. #RAKUSMeetup ©2021 RAKUS Co., Ltd. ラックBのレイアウトも保守性と基本設計(ポリシー)を考慮して、 搭載位置を設計する必要がある。 サーバの熱対策と保守・メンテナンスの 際の作業効率を考慮し、ラックの マウント位置を設計する。

    ファシリティの設計 ~サーバの保守性~ 【変更前】 ラックA ラックB サーバ #1 ★ サーバ #2 ★ サーバ #3 サーバ #4 SW #2 SW #1 サーバ サーバ #5 サーバ #6 SW #4 SW #3 【変更後】 ラックA ラックB サーバ #1 ★ サーバ #2 ★ サーバ #3 サーバ #4 SW #2 SW #1 サーバ サーバ #5 サーバ #6 SW #4 SW #3 新サーバ #1 ★ 新サーバ #2 ★ ※ラック構成図はイメージです。
  6. #RAKUSMeetup ©2021 RAKUS Co., Ltd. ラックBにサーバを追加することで、ラックA-B間の帯域が十分確保できて いることを確認する。 また、将来の拡張性も考慮する。 ラックBのサーバ台数が2倍になり、 通信量が増加することと、

    サービス拡大による仮想マシンの 台数が大幅に増加している事を 考慮して再設計する。 ファシリティの設計 ~ネットワーク帯域(拡張性)~ 【変更前】 ラックA ラックB サーバ #1 ★ サーバ #2 ★ サーバ #3 サーバ #4 SW #2 SW #1 サーバ サーバ #5 サーバ #6 SW #4 SW #3 【変更後】 ラックA ラックB サーバ #1 ★ サーバ #2 ★ サーバ #3 サーバ #4 SW #2 SW #1 サーバ サーバ #5 サーバ #6 SW #4 SW #3 新サーバ #1 ★ 新サーバ #2 ★ ※ラック構成図はイメージです。
  7. #RAKUSMeetup ©2021 RAKUS Co., Ltd. 新たな要件 既存サーバへパッチを適用する。 パッチ適用にサーバの再起動が必要! メンテナンス対象の仮想マシンを 新サーバに2台へ分散して

    サーバ#3へパッチ適用する。 他のサーバについても順次パッチ適用を実施。 運用上の課題が 見つかる データ移行の設計 分散 分散 メンテナンス
  8. #RAKUSMeetup ©2021 RAKUS Co., Ltd. 運用設計 課題:仮想マシンの偏りがある。 配配メール/クルメルでも複数のサーバで構成されている。 メール作成サーバ(共用サーバ、専用サーバ)、メール配信サーバ、 メール配信の解析サーバ、APIサーバ、…

    新規に仮想マシンを構築する際、基盤サーバの空きリソースによって仮想マシンを作成していたため、 サーバの役割で偏りが発生していました。そのため、負荷が集中するときがありました。 そこで、次の観点で対策を検討しました。
  9. #RAKUSMeetup ©2021 RAKUS Co., Ltd. ①仮想マシンの役割ごとにグループを分けて、各グループで平準化する 7台 ⇒ 各基盤サーバ 1~2台

    9台 ⇒ 各基盤サーバ 2~3台 8台 ⇒ 各基盤サーバ 2 台 11台 ⇒ 各基盤サーバ 2~3台 運用設計 VM VM VM VM
  10. #RAKUSMeetup ©2021 RAKUS Co., Ltd. ②各仮想マシンのリソースで平準化する。 全体で使用するリソースの合計をサーバ台数分で割ると、 基盤サーバ1台あたり、CPU:110÷4≒27.5 メモリ:162÷4≒40.5 とな

    るように配置する設計としました。 運用設計 仮想マシン 台数 1台あたり CPU[コア] CPU 合計[コア] 1台あたり メモリ [GB] メモリ 合計[GB] VM 7 4 28 8 56 VM 9 4 36 4 36 VM 8 3 24 6 48 VM 11 2 22 2 22 合計 35 110 162